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OM nucleic - nucleic search, using sw model 
Run on: 



February 21, 2005, 09:37:08 ; Search time 11131 Seconds 

(without alignments ) 
11583.805 Million cell updates/sec 



Title: 

Perfect score: 
Sequence : 



US-10-039-272-1 
2661 

1 cggcacgagggcccagagga 



aaaaaaaaaaaaaaaaaaaa 2661 



Scoring table: I DENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 



4708233 seqs, 24227607955 residues 



Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



9416466 



Database : 



GenEmbl : * 



1: 




gb ba:* 


2 




gb_htg : * 


3 




gb in:* 


4 




gb om : * 


5: 




gb ov:* 


6: 




gb pat:* 


7 




gb ph : * 


8; 




gb pi : * 


9: 




gb p r : * 


10: 


gb ro : * 


11: 


gb sts:* 


12: 


gb_sy : * 


13: 


gb_un : * 


14: 


gb_vi : * 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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1 2650 99.6 2662 9 AF322909 

2 2547.8 95.7 2669 6 AR018808 

3 2547.8 95.7 2669 6 AR018814 



AF322909 Homo sapi 
AR018808 Sequence 
AR018814 Sequence 
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ALIGNMENTS 



RESULT 1 
AF322909 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



AF322909 2662 bp mRNA linear PRI 23-APR-2003 

Homo sapiens transmembrane glycoprotein HGFIN mRNA, complete cds . 
AF322909 

AF322909 . 1 GI : 11993664 
■ 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 



REFERENCE 
AUTHORS 

TITLE 



JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

FEATURES 

source 



CDS 



Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 2662) 

Bandari, P . S . , Qian,J., Yehia,G., Joshi,D.D., Maloof,P.B., 
Potian, J., Oh,H.S., Gascon, P., Harrison, J . S . and Rameshwar,P. 
Hematopoietic growth factor inducible neurokinin-1 type: a 
transmembrane protein that is similar to neurokinin 1 interacts 
with substance P 

Regul. Pept. Ill (1-3), 169-178 (2003) 

22498106 

12609765 

2 (bases 1 to 2662) 
Rameshwar , P . 
Direct Submission 

Submitted (20-NOV-2000) Medicine, UMDNJ-New Jersey Medical School, 
185 South Orange Ave, MSB, Rm. E-579, Newark, NJ 07103, USA 

Location/Qualifiers 

1. .2662 

/organism= l! Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon:9606" 

/tissue_type= fl bone marrow peripheral blood" 
60. .1742 

/note="hematopoietic growth f actor-inducible neurokinin-1 

protein" 

/codon_start=l 

/product=" transmembrane glycoprotein HGFIN" 
/protein_id="AAG42839. 1" 
/db_xref="GI : 11993665" 

/ 1 r ans 1 a t i on= "MECLYYFLGFLLLAARLPLDAAKRFHDVLGNERP SAYMREHNQL 
NGWSSDENDWNEKLYPVWKRGDMRWKNSWKGGRVQAVLTSDSPALVGSNITFAVNLIF 
PRCQKEDANGNIVYEKNCRNEAGLSADPYVYNWTAWSEDSDGENGTGQSHHNVFPDGK 
PFPHHPGWRRWNFIYVFHTLGQYFQKLGRCSVRVSVNTANVTLGPQLMEVTVYRRHGR 
AYVPIAQVKDVYWTDQIPVFVTMFQKNDRNSSDETFLKDLPIMFDVLIHDPSHFLNY 
STINYKWSFGDNTGLFVSTNHTVNHTYVLNGTFSLNLTVKAAAPGPCPPPPPPPRPSK 
PTPSLGPAGDNPLELSRIPDENCQINRYGHFQATITIVEGILEVNIIQMTDVLMPVPW 
PESSLIDFWTCQGSIPTEVCTIISDPTCEITQNTVCSPVDVDEMCLLTVRRTFNGSG 
TYCVNLTLGDDTSLALTSTLISVPDRDPASPLRMANSALI SVGCLAI FVTVI SLLVYK 
KHKEYNPIENSPGNWRSKGLSVFLNRAKAVFFPGNQEKDPLLKNQEFKGVS " 



ORIGIN 



Query Match 99.6%; Score 2650; DB 

Best Local Similarity 100.0%; Pred. No. 0; 
Matches 2661; Conservative 0; Mismatches 



9; Length 2662; 
0; Indels 1; 



Gaps 



l; 



Qy 

Db 



1 CGGCACGAGGGCCCAGAGGAATAAGTTAACCTTGGTGCCTGCGTCCGTGAGAATTCAGCA 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

1 CGGCACGAGGGCCCAGAGGAATAAGTTAACCTTGGTGCCTGCGTCCGTGAGAATTCAGCA 60 



Qy 

Db 



61 TGGAATGTCTCTACTATTTCCTGGGATTTCTGCTCCTGGCTGCAAGATTGCCACTTGATG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II 
61 TGGAATGTCTCTACTATTTCCTGGGATTTCTGCTCCTGGCTGCAAGATTGCCACTTGATG 120 



Qy 

Db 



121 C CGC CAAAC GATTT CAT GAT GT GCTGGGCAAT GAAAGAC CTT CT GCT T ACAT GAG GGAGC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

121 CCGCCAAACGATTTCATGATGTGCTGGGCAATGAAAGACCTTCTGCTTACATGAGGGAGC 180 



Qy 



181 ACAAT CAAT T AAAT GGCTGGTCTTCT GAT GAAAAT GAC T G GAAT GAAAAAC T C T AC C C AG 24 0 



Db 181 ACAAT CAAT TAAAT GGCTGGTCTTCT GAT GAAAAT GACT GGAAT GAAAAACT CT AC C GAG 240 

Qy 241 TGTGGAAGCGGGGAGACATGAGGTGGAAAAACTCCTGGAAGGGAGGCCGTGTGCAGGCGG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 TGTGGAAGCGGGGAGACATGAGGTGGAAAAACTCCTGGAAGGGAGGCCGTGTGCAGGCGG 300 

Qy 301 T C CT GAC CAGT GACT CAC CAGC CCT CGT GGGCT CAAAT ATAACATT T GC GGT GAAC CT GA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I 1 I I I I I I I I I I I I 

Db 301 T C CT GAC CAGT GACT CAC CAGC CCTC GT GGGCT CAAAT AT AACAT T T GCGGT GAACCT GA 360 

Qy 361 TATT CCCTAGATGCCAAAAGGAAGAT GCCAAT GGCAACATAGT CTATGAGAAGAACTGCA 420 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 TAT T C CCT AGAT GC CAAAAGGAAGAT GC CAAT GGCAACATAGT CTAT GAGAAGAACT GCA 420 

Qy 421 GAAAT GAGGCT G GT T TAT CT GCTGAT CCAT AT GTT T ACAACT GGACAG CAT GGT CAGAGG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 GAAAT GAGGCT GGT T TAT CT GCT GAT C CAT AT GT T T ACAACT G GACAGCAT GGT CAGAGG 480 

Qy 481 ACAGT GAC GG GGAAAAT GGC AC CGGC CAAAGC CAT CATAAC GT CT T C C CT GAT G GGAAAC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 ACAGT GAC GGG GAAAAT GGCAC C GGC CAAAGC CAT CATAAC GT CT T C C CT GAT GGGAAAC 540 

Qy 541 CT TT T C CT CAC CAC CC CGGAT GGAGAAGAT GGAAT T T CAT CT AC GT CTT C CACAC ACTT G 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 CT T TT C CT CAC CAC CC CG GAT GGAGAAGAT GGAAT TTC AT CT AC GT CTT C C ACACACTT G 600 

Qy 601 GT C AGT ATTT C CAGAAAT T GGGAC GAT GTT CAGT GAGAGT T T CT GT GAACACAG C CAAT G 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 GT CAGTATTT C CAGAAAT T G GGAC GAT GTT CAGT GAGAGT T T CT GT GAACACAG C CAAT G 660 

Qy 661 TGACACTT GGGCCT CAACTCAT GGAAGT GACT GTCTACAGAAGACATGGACGGGCATATG 720 

I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 661 T GACACTT GGGCCT CAACTCAT GGAAGT GACTGT CTACAGAAGACAT GGACGGGCATAT G 720 

Qy 721 TT C C CAT C GC ACAAGT GAAAGAT GT GTAC GT G GTAAC AGAT CAGAT T C CT GT GT TT GT GA 780 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 T T C C CAT C G C AC AAGT GAAAGAT GT GTAC GT G GTAAC AG AT CAGAT TCCTGTGTTTGT G A 780 

Qy 781 CTAT GTT C CAGAAGAAC GAT C GAAAT T CAT CC GACGAAAC C TTC C - CAAAGAT CT C C C CA 839 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 CTAT GTT C CAGAAGAAC GAT C GAAATT CAT CC GACGAAAC CT T C CT CAAAGAT CT C CC CA 840 

Qy 840 TTATGTTT GATGTCCT GATTCATGAT CCTAGCCACTTCCT CAATTATT CTACCATTAACT 899 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I 
Db 841 TTAT GT TT GATGT C CT GATT CAT GAT CCTAGC CACT T C CT CAAT TATT CTACCATTAACT 900 

Qy 900 ACAAGTGGAGCTTCGGGGATAATACTGGCCTGTTT GTTT CCACCAATCATACT GT GAAT C 959 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 ACAAGT GGAGCT T C GGGGATAAT ACT GGCCT GTT T GTTT C CAC CAAT CAT ACT GT GAATC 960 

Qy 960 ACACGTATGTGCTCAATGGAACCTTCAGCCTTAACCTCACTGTGAAAGCTGCAGCACCAG 1019 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 ACACGTATGTGCTCAATGGAACCTTCAGCCTTAACCTCACTGTGAAAGCTGCAGCACCAG 1020 

Qy 1020 GACCTTGTCCGCCACCGCCACCACCACCCAGACCTTCAAAACCCACCCCTTCTTTAGGAC 1079 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 



Db 1021 GACCTTGTCCGCCACCGCCACCACCACCCAGACCTTCAAAACCCACCCCTTCTTTAGGAC 1080 

Qy 1080 CTGCTGGTGACAACCCCCTGGAGCTGAGTAGGATTCCTGATGAAAACTGCCAGATTAACA 1139 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1081 CTGCTGGTGACAACCCCCTGGAGCTGAGTAGGATTCCTGATGAAAACTGCCAGATTAACA 1140 

Qy 114 0 GATATGGCCACTTT CAAGCCACCATCACAATT GTAGAGGGAAT CTTAGAGGTTAACATCA 1199 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 1141 GATAT GGCC ACT T T CAAGC CACCAT CACAAT T GTAGAG G GAAT CT T AGAGGTTAACAT CA 1200 

Qy 1200 T C CAGAT GACAGACGT C CT GATGC C GGT GC CAT GGC CT GAAAGCT CC CTAAT AGACTTT G 1259 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 TC CAGAT GACAGAC GT C CT GATGC C GGT GC CAT GGCCT GAAAGCT C C CTAAT AGACTT T G 1260 

Qy 1260 TCGTGACCTGCCAAGGGAGCATTCCCACGGAGGTCTGTACCATCATTTCTGACCCCACCT 1319 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 1261 TCGTGACCTGCCAAGGGAGCATTCCCACGGAGGTCTGTACCATCATTTCTGACCCCACCT 1320 

Qy 1320 GC GAGAT CAC C CAGAACACAGT CT G CAG CC CT GT GGAT GT GGAT GAGAT GT GT CT GCT GA 1379 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 GC GAGAT CAC C CAGAACACAGT CT G CAGC C CT GTGGAT GT GGAT GAGAT GT GTCT GCT GA 1380 

Qy 1380 CTGTGAGACGAACCTTCAATGGGTCTGGGACGTACTGTGTGAACCTCACCCTGGGGGATG 1439 

I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I II I I II I I I I I II I I II 

Db 1381 CTGTGAGACGAACCTTCAATGGGTCTGGGACGTACTGTGTGAACCTCACCCTGGGGGATG 144 0 

Qy 144 0 ACACAAG CCT GGCT CT CAC GAGCAC C CT GAT T T CT GT T C CT GAC AGAGAC C CAGC CT C GC 14 99 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1441 ACACAAGCCTGGCTCTCACGAGCACCCTGATTTCTGTTCCTGACAGAGACCCAGCCTCGC 1500 

Qy 1500 CTTTAAGGATGGCAAACAGTGCCCTGATCTCCGTTGGCTGCTTGGCCATATTTGTCACTG 1559 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1501 CTTTAAGGATGGCAAACAGTGCCCTGATCTCCGTTGGCTGCTTGGCCATATTTGTCACTG 1560 

Qy 1560 T GAT CT C CCT CTT GGT GTACAAAAAACACAAGGAAT ACAACC CAAT AGAAAATAGT C CT G 1619 

I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1561 T GAT CT CCCTCTTGGT GT ACAAAAAACACAAG GAAT ACAAC CCAAT AGAAAATAGT C CT G 1620 

Qy 1620 GGAATGTGGTCAGAAGCAAAGGCCTGAGTGTCTTTCTCAACCGTGCAAAAGCCGTGTTCT 1679 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 GGAATGTGGTCAGAAGCAAAGGCCTGAGTGTCTTTCTCAACCGTGCAAAAGCCGTGTTCT 1680 

Qy 1680 TC C C GG GAAAC CAGGAAAAGGAT CC G CT ACT CAAAAAC CAAGAAT TTAAAGGAGT T T CTT 1739 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 1681 TCCCGGGAAACCAGGAAAAGGATCCGCTACTCAAAAACCAAGAATTTAAAGGAGTTTCTT 1740 

Qy 1740 AAATTTCGACCTTGTTTCTGAAGCTCACTTTTCAGTGCCATTGATGTGAGATGTGCTGGA 1799 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 1741 AAATTTCGACCTTGTTTCTGAAGCTCACTTTTCAGTGCCATT GAT GT GAGAT GTGCTGGA 1800 

Qy 1800 GTGGCTATTAACCTTTTTTTCCTAAAGATTATTGTTAAATAGATATTGTGGTTTGGGGAA 1859 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1801 GTGGCTATTAACCTTTTTTTCCTAAAGATTATTGTTAAATAGATATTGTGGTTTGGGGAA 1860 

Qy 1860 GTT GAATTT TT T ATAGGT TAAAT GT CATT T T AGAGAT GGGGAGAGGGATTATACT GC AGG 1919 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1861 GT TGAAT TTT TT AT AG GTTAAAT GT CATTTTAGAGAT G GGGAGAGGGAT TAT ACT GCAGG 1920 



Qy 1920 CAGCTTCAGCCATGTTGTGAAACTGATAAAAGCAACTTAGCAAGGCTTCTTTTCATTATT 1979 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 CAGCTT CAGC C AT GTTGT GAAACT GAT AAAAGCAACTT AGCAAGGCT T CT TTTCAT TAT T 1980 

Qy 1980 TT TT AT GTT T CACTTATAAAGT CTT AGGTAACT AGTAGGATAGAAACACT GT GT C C C GAG 2039 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 TTTT AT GTT T CACTTATAAAGT CTTAGGTAACT AGTAGGATAGAAACACT GT GT C C C GAG 2040 

Qy 2040 AGTAAGGAGAGAAGCTACT AT T GATTAGAGC CTAAC C CAGGTTAACT GCAAGAAGAGGC G 2099 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I 

Db 2041 AGTAAGGAGAGAAGCTACTATTGATTAGAGCCTAACCCAGGTTAACTGCAAGAAGAGGCG 2100 

Qy 2100 GGATACTTTCAGCTTTCCATGTAACTGTATGCATAAAGCCAATGTAGTCCAGTTTCTAAG 2159 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 GGATACTT T CAGCTTT CCAT GTAACT GT AT GCATAAAGC CAAT GT AGT C C AGTT TCT AAG 2160 

Qy 2160 AT CATGTT CCAAGCTAACT GAATCCCACTT CAATACACACTCATGAACTCCTGATGGAAC 2219 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 AT CATGTT CCAAGCTAACT GAAT CCCACTT CAATACACACTCATGAACTCCTGATGGAAC 2220 

Qy 2220 AATAACAGGCCCAAGCCT GTGGTATGAT GTGCACACTT GCTAGACT CAGAAAAAATACTA 2279 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2221 AATAACAGGCCCAAGCCTGT GGTAT GAT GTGCACACTT GCTAGACT CAGAAAAAATACTA 2280 

Qy 2280 CTCTCATAAATGGGTGGGAGTATTTTGGTGACAACCTACTTTGCTTGGCTGAGTGAAGGA 2339 

I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I . 
Db 2281 CTCTCATAAATGGGTGGGAGTATTTTGGTGACAACCTACTTTGCTTGGCTGAGTGAAGGA 2340 

Qy 2340 AT GATATT CATATATTCATTTATT CCAT GGACATTTAGTTAGT GCTTTTTATATACCAGG 2399 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 AT GATATT CATATATTCATTTATT CCAT GGACATTTAGTTAGT GCTTTTTATATACCAGG 24 00 

Qy 2400 CAT GAT G CT GAGT GACACT CTT GT GT AT AT TT C CAAATTTTT GT AT AGT CG CT GCACATA 2459 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 01 CAT GAT G CT GAGT GACACT CT T GT GT AT AT TT C CAAAT T TTT GT AT AGT C G CT GCACATA 24 60 

Qy 24 60 TT T GAAAT CAAAATATTAAGACT T T C CAAAAAT TTGGTCCCTGGTTTTT C AT GGCAACT T 2519 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2461 TTTGAAATCAAAATATTAAGACTTTCCAAAAATTTGGTCCCTGGTTTTTCATGGCAACTT 2520 

Qy 2520 GATCAGTAAGGATTTCCCCTCT GTTT GGAACTAAAACCATTTACTATAT GTTAGACAAGA 2579 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 GAT CAGTAAGGATTT CCC CT CT GT TT GGAACTAAAAC CATTT ACT AT AT GT T AGACAAGA 2580 

Qy 2580 CATTTTTTTTTTTTCCTTCCTGAAAAAAAAATGAGGGAAGAGACAAAAAAAAAAAAAAAA 2639 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 2581 C ATT TTT T TT TT TT CCTT C CT GAAAAAAAAAT GAG GGAAGAGACAAAAAAAAAAAAAAAA 2640 

Qy 2640 AAAAAAAAAAAAAAAAAAAAAA 2661 

I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 AAAAAAAAAAAAAAAAAAAAAA 2662 



RESULT 2 
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linear PAT 05-DEC-1998 



DEFINITION Sequence 91 from patent US 5783182. 

ACCESSION AR018808 

VERSION AR018808.1 GI: 3973922 

KEYWORDS 

SOURCE Unknown. 

ORGANISM Unknown . 

Unclassified. 
REFERENCE 1 (bases 1 to 2669) 

AUTHORS Thompson , T . C . 

TITLE Method for identifying metastatic sequences 

JOURNAL Patent: US 5783182-A 91 21-JUL-1998; 
FEATURES Loca tion/Quali f iers 

source 1. .2669 

/ organism= ,f unknown M 
/mol_type="unassigned DNA" 

ORIGIN 

Query Match 95.7%; Score 2547.8; DB 6; Length 2669; 

Best Local Similarity 99.2%; Pred. No. 0; 

Matches 2591; Conservative 0; Mismatches 17; Indels 3; Gaps 3; 

Qy 28 AACCTTGGTGCCTGCGTCCGTGAGAATTCAGCATGGAATGTCTCTACTATTTCCTGGGAT 87 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 60 ACCTT GAGT GCCTGCGTCCGT GAGAAT T CAG CAT GGAAT GT CT CTACT AT T T C CT GGGAT 119 

Qy 88 TTCTGCTCCTGGCTGCAAGATTGCCACTTGATGCCGCCAAACGATTTCATGATGTGCTGG 147 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 120 TTCTGCTCCTGGCTG CAAGAT TGC CACT TGAT GC C GC CAAAC GATT T CAT GAT GT GCT GG 179 

Qy 148 GCAAT GAAAGAC CT T CT G CTT ACAT GAG GGAGCACAATCAAT TAAAT GGCT GGT CTT CT G 207 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 180 GCAATGAAAGACCTTCTGCTTACATGAGGGAGCACAATCAATTAAATGGCTGGTCTTCTG 239 

Qy 208 ATGAAAAT GACT GGAAT GAAAAACT CT ACC CAGT GT G GAAG C G G GGAGACAT GAGGT G GA 267 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 240 ATGAAAAT GACT GGAAT GAAAAACT CTACCCAGTGTGGAAGC GGGGAGACAT GAGGT GGA 299 

Qy 268 AAAACTCCTGGAAGGGAGGCCGTGTGCAGGCGGTCCTGAC CAGT GACT CACCAGCCCTCG 327 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 300 AAAACTCCTGGAAGGGAGGCCGTGTGCAGGCGGTCCTGACCAGTGACTCACCAGCCCTCG 359 

Qy 328 T GGGCT CAAATATAACAT T TGC GGT GAACCT GATATT C C CT AGATGC CAAAAGGAAGAT G 387 

I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 360 T GG GCT CAAATATAACATTT GCG GT GAACCT GAT AT T C CCT AGAT G C CAAAAGGAAGAT G 419 

Qy 388 CCAAT GGCAACATAGTCTATGAGAAGAACT GCAGAAATGAGGCT GGTTTAT CT GCTGAT C 447 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 420 C CAAT GGCAACAT AGT CT AT GAGAAGAACT GCAGAAAT GAGG CT GGTT T AT CT GCT GAT C 47 9 

Qy 44 8 CAT AT GTT T ACAACT GGACAGCAT GGT CAGAGGACAGT GACGGG GAAAAT GGC ACC GGC C 507 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 480 CAT AT GT T T ACAACT G GACAGCAT G GTCAGAG GAC AGT GAC G GGGAAAAT GGCAC CGGCC 539 



Qy 

Db 



508 AAAGC CAT CATAACGT CTT CCCT GAT GGGAAACCT TTT C CT CAC CACC C C GGATGGAGAA 567 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

54 0 AAAGC CAT CATAAC GT CTT CC CT GAT GG GAAAC CTTT T CCT CAC CAC CC C GGAT GGAGAA 599 



Qy 568 GATGGAATTTCAT CTACGT CTTCCACACACTT GGT CAGT ATTTCCAGAAATTGGGAC GAT 627 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 600 GATGGAATTTCAT CTACGT CTTCCACACACTTGGT CAGTATTTCCAGAAATT GGGACGAT 659 

Qy 628 GTT CAGT GAGAGTT T CT GT GAACACAGCCAAT GT GACACT T GG GC CT CAACT C ATGGAAG 687 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 660 GTT CAGT GAGAGT T T CT GT GAACACAGC CAAT GT GAC ACTT GGGC CT CAACT C AT GGAAG 719 

Qy 688 TGACTGT CTACAGAAGACAT GGACGGGCATAT GTT CCCAT CGCACAAGT GAAAGATGTGT 747 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 720 TGACTGT CTACAGAAGACATGGACGGGCAT AT GTT CCCAT CGCACAAGT GAAAGAT GT GT 77 9 

Qy 748 AC GT GGTAACAGAT CAGATT C CT GT GT T T GT GACT AT GT T CCAGAAGAAC GAT CGAAAT T 807 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 780 AC GT GGTAACAGAT CAGAT T C CT GT GTTTGT GACT AT GTT C CAGAAGAAC GAT C GAAAT T 839 

Qy 808 CATCCGACGAAACCTT CC- CAAAGAT CTCCCCATTAT GTTTGAT GTCCT GATTCATGATC 866 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 840 CAT C C GAC GAAACCTT C CT CAAAGAT CT CCCCATT AT GT TT GAT GT C CT GAT TCAT GAT C 899 

Qy 8 67 CTAGCCACTTCCTCAATTATTCTACCATTAACTACAAGTGGAGCTTCGGGGATAATACTG 926 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 900 CTAGCCACTTCCTCAATTATTCTACCATTAACTACAAGTGGAGCTTCGGGGATAATACTG 959 

Qy 927 GC CT GT TT GTT T C CACCAAT CAT ACT GT GAAT CACAC GT AT GT G CT CAAT GGAAC CTT CA 98 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 960 GC CT GTTT GTTT C CAC CAAT CAT ACT GT GAAT CACAC GT AT GT GCT CAAT GGAAC CT T C A 1019 

Qy 987 GC CT T AACCT CACT GT GAAAGCT GCAGCAC CAGGAC CT T GT C C GC CACCG C CAC CAC CAC 1046 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II 

Db 1020 GCCTTAACCTCACTGTGAAAGCTGCAGCACCAGGACCTTGTCCGCCACCGCCACCACCAC 107 9 

Qy 1047 CCAGACCTTCAAAACCCACCCCTTCTTTAGGACCTGCTGGTGACAACCCCCTGGAGCTGA 1106 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1080 CCAGACCTTCAAAACCCACCCCTTCTTTAGGACCTGCTGGTGACAACCCCCTGGAGCTGA 1139 

Qy 1107 GT AGGATT C CT GAT GAAAACT GCCAGATTAACAGAT AT GGC CACTTT CAAGC CAC CAT CA 1166 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1140 GTAGGATTCCT GAT GAAAACT GCCAGATTAACAGAT AT GGCCACTTT CAAGCCAC CAT CA 1199 

Qy 1167 CAATT GTAGAGGGAAT CTTAGAGGTTAACAT CATCCAGAT GACAGACGT CCTGAT GCCGG 1226 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1200 CAATT GTAGAGG GAAT CTTAGAG GT TAACAT C AT CCAGAT GACAGAC GT CCT GAT GCCGG 1259 

Qy 1227 TGCCATGGCCTGAAAGCTCCCTAATAGACTTTGTCGTGACCTGCCAAGGGAGCATTCCCA 1286 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1260 TGCCATGGCCTGAAAGCTCCCTAATAGACTTTGTCGTGACCTGCCAAGGGAGCATTCCCA 1319 

Qy 1287 CG GAGGT CT GT ACCAT CATTT CT GAC CCCAC CT GCGAGAT CAC CCAGAACACAGT CT GCA 134 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1320 CGGAGGT CT GT AC CAT CAT TT CT GACCC CAC CT GC GAGAT CAC C CAGAACAC AGT CT GCA 1379 

Qy 1347 GC C CT GT GGAT GT GGAT GAGAT GT GT CT GCT GACT GT GAGAC GAACCT T CAATGGGT CT G 1406 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 
Db 1380 GC C CT GT GGAT GTGGAT GAGAT GT GT CT GCT GACT GT GAGAC GAAC CTT CAAT G GGT CT G 1439 

Qy 1407 GGAC GT ACT GT GT GAAC CT CAC CCT GGG GGAT GACACAAGC CT GG CT CT CAC GAGCACC C 1466 



Db 1440 GGACGTACTGTGTGAACCTCACCCTGGGGGATGACACAAGCCTGGCTCTCACGAGCACCC 14 99 

Qy 1467 TGATTTCTGTTCCTGACAGAGACCCAGCCTCGCCTTTAAGGATGGCAAACAGTGCCCTGA 1526 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1500 T GATT T CT GT TC CT GAC AGAGACC CAGC CT C GC CT TTAAGGAT GGCAAAC AGT GC C CT GA 1559 

Qy 1527 TCTCCGTTGGCTGCTTGGCCATATTTGTCACTGTGATCTCCCTCTTGGTGTACAAAAAAC 1586 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 1560 TCTCCGTTGGCTGCTTGGCCATATTTGTCACTGTGATCTCCCTCTTGGTGTACAAAAAAC 1619 

Qy 1587 ACAAGGAATACAAC C CAATAGAAAAT AGTC CT GGGAAT GT GGT CAGAAGCAAAGGCCT GA 1646 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1620 ACAAGGAATACAAC C CAATAGAAAAT AGTC CT GGGAAT GT GGT CAGAAG CAAAGG CCT GA 1679 

Qy 1647 GTGTCTTTCTCAACCGTGCAAAAGCCGTGTTCTTCCCGGGAAACCAGGAAAAGGATCCGC 1706 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1680 GTGTCTTTCTCAACCGTGCAAAAGCCGTGTTCTTCCCGGGAAACCAGGAAAAGGATCCGC 1739 

Qy 1707 TACTCAAAAACCAAGAATTTAAAGGAGTTTCTTAAATTTCGACCTTGTTTCTGAAGCTCA 1766 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I 

Db 1740 TACT CAAAAACCAAGAAT T TAAAG GAGT TT CT TAAAT TT C GAC CTT GTTT CT GAAGCT CA 1799 

Qy 1767 CTTTTCAGTGCCATTGATGTGAGATGTGCTGGAGTGGCTATTAACCTTTTTTTCCTAT^AG 1826 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1800 CTTTTCAGTGCCATTGATGTGAGATGTGCTGGAGTGGCTATTAACCTTTTTTTCCTAAAG 1859 

Qy 1827 ATT AT T GT TAAAT AGAT AT T GT GGTTT GGGGAAGT TGAAT T TTT T ATAGGT TAAAT GT C A 1886 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 18 60 ATTATTGTTAAATAGATATTGTGGTTTGGGGAAGTTGAATTTTTTATAGGTTAAATGTCA 1919 

Qy 18 87 T TTTAGAGAT GG G GAGAGGGATT AT ACT GCAGG CAGCT T C AGCC AT GT T GT GAAACT GAT 194 6 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1920 T TTTAGAGAT GG G GAGAGGGATT AT ACT GCAGGCAGCT T CAG CC AT GTT GT GAAACT GAT 1979 

Qy 1947 AAAAG CAACT TAGCAAGGCTT CTT T T CATTAT T T T TTAT GT T T CACTT ATAAAGT CTT AG 2006 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1980 AAAAGCAACTTAGCAAGGCTTCTTTTCATTATTTTTTATGTTTCACTTATAAAGTCTTAG 2039 

Qy 2007 GTAACTAGTAGGATAGAAACACTGTGTCCCGAGAGTAAGGAGAGAAGCTACTATTGATTA 2066 

I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I 
Db 2040 GTAACTAGTAGGATAGAAACACT GT GTCCCGAGAGTAAGGAGAGAAGCTACTATT GATTA 2099 

Qy 2067 GAGCCTAACCCAGGTTAACTGCAAGAAGAGGCGGGATACTTTCAGCTTTCCATGTAACTG 2126 

I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2100 GAGCCTAACCCAGGTTAACTGCAAGAAGAGGCGGGATACTTTCAGCTTTCCATGTAACTG 2159 

Qy 2127 TAT GCATAAAGC CAAT GT AGT C CAGTTT CTAAGAT CAT GT T C CAAGCTAACT GAAT C C C A 2186 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2160 TAT G CAT AAAGC CAAT GTAGT C CAGTTT CTAAGAT CAT GT T C CAAGCTAACT GAAT C C CA 2219 

Qy 2187 CTT CAAT AC ACACT CAT GAACT C CT GAT GGAACAATAACAG GC C CAAGC CT GT GGT AT GA 224 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2220 CTT CAAT ACACACT CATGAACTCCTGAT GGAACAATAACAGGCCCAAGCCTGTGGTAT GA 2279 

Qy 2247 T GT GCACACTTGCTAGACTCAGAAAAAATACT ACT CTCATAAAT GGGTGGGAGTATTTT G 2306 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 



Db 



2280 



TGTGCACACTTGCTAGACTCAGAAAAAATACTACTCTCATAAATGGGTGGGAGTATTTTG 



2339 



Qy 2307 GT GACAACCTACTTT GCTT G GCT GAGT GAAGGAATGATAT TCAT AT AT T CAT TTATT CCA 2366 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2340 GT GACAACCTACTTT GCTT GGCT GAGT GAAGGAATGATAT TCAT AT AT T CATTTATT CCA 2399 

Qy 2367 T GGACAT TTAGT TAGT GCTT TT TATATAC CAGGCAT GAT GCT GAGT GACACT CT T GT GTA 2426 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 24 00 T G GACAT TTAGTTAGT GCTT TT TATATAC CAGGCAT GATGCT GAGT GACACT CT T GT GTA 2459 

Qy 2427 TATTT CCAAAT T TTT GT AT AGT C GCT GCACAT AT TT GAAAT CAAAATATTAAGACTTT C C 2486 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 24 60 T ATT T CCAAAT T TTT GTAT AGT C GCT GCACAT AT TT GAAAT C - AT ATATTAAGACTTT C C 2518 

Qy 24 87 AAAAATTTGGTCCCTGGTTTTTCATGGCAACTTGATCAGTAAGGATTTCCCCTCTGTTTG 254 6 

III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2519 AAAGATGAGGTCCCTGGTTTTTCATGGCAACTTGATCAGTAAGGATTTCACCTCTGTTTG 2578 

Qy 2547 GAACTAAAACC ATTT ACT ATAT GTTAGACAAGACAT TTTTTT TT T T T C CT T C CT GAAAAA 2606 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2579 TAACTAAAACCAT CT ACT AT AT GTTAGACAT GACAT TCTTTTTCTCTCCTTCCT GAAAAA 2638 

Qy 2607 -AAAATGAGGGAAGAGACAAAAAAAAAAAAA 2636 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 639 TAAAGT GT GG GAAGAGACAAAAAAAAAAAAA 2669 
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ALIGNMENTS 



RESULT 1 
ABQ78551 

ID ABQ78551 standard; DNA; 2661 BP. 
XX 

AC ABQ78551; 
XX 

DT 25-NOV-2002 (first entry) 
XX 

DE Nucleotide sequence of human HGFIN. 
XX 

KW Human; cell differentiation; white blood cell; bone marrow cell; 

KW haematopoietic growth factor inducible neurokin-1; HGFIN; 

KW progenitor proliferation; acute myeloid leukemia; non-Hodgkin ' s disease; 

KW acute lymphocytic leukemia; chronic myeloid leukemia; 

KW chronic lymphocytic leukemia; Hodgkin f s disease; gene; ss. 

XX 

OS Homo sapiens. 
XX 

FH Key Location/Qualifiers 

FT CDS 60. .1741 

FT /*tag= a 

FT /product= "HGFIN" 

FT /transl_except= (825. .826,aa:Leu) 

XX 

PN WO200262947-A2. 
XX 

PD 15-AUG-2002. 
XX 

PF 20-OCT-2001; 2001WO-US050204 . } 
XX 

PR 20-OCT-2000; 2000US-0241881P . 
XX 

PA (UYNE-) UNIV NEW JERSEY MEDICINE & DENTISTRY. 
XX 

PI Pranela R; 
XX 

DR WPI; 2002-657531/70. 
DR P-PSDB; ABB78200. 
XX 

PT Hematopoietic growth factor inducible neurokin-1 type polypeptide and 
PT polynucleotide for treating a disease associated with abnormal bone 
PT marrow cell differentiation or prolif eration, e.g. leukemia. 
XX 



PS Claim 2; Page 121-123; 125pp; English. 
XX 

CC The present sequence encodes human haematopoietic growth factor inducible 

CC neurokin-1 type (HGFIN) polypeptide. HGFIN induces white blood cell 

CC differentiation and inhibits progenitor proliferation. HGFIN polypeptides 

CC and polynucleotides are useful for treating a disease associated with 

CC abnormal bone marrow cell differentiation or proliferation, especially 

CC acute myeloid leukemia, acute lymphocytic leukemia, chronic myeloid 

CC leukemia, chronic lymphocytic leukemia, Hodgkin's and non-Hodgkin 1 s 

CC disease 

XX 

SQ Sequence 2661 BP; 772 A; 586 C; 587 G; 716 T; 0 U; 0 Other; 



Query Match 100.0%; Score 2661; DB 6; Length 2661; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2661; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 C GG CAC GAGGG CC C AGAGGAATAAGTTAAC CTT GGT GC CT G CGT C C GT GAGAATT C AGCA 60 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 C GG CAC GAGGG CC C AGAGGAATAAGT TAAC CTT GGT GC CT G CGT C C GT GAGAATT CAGCA 60 

Qy 61 TGGAATGTCTCTACTATTTCCTGGGATTTCTGCTCCTGGCTGCAAGATTGCCACTTGATG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 TGGAATGTCTCTACTATTTCCTGGGATTTCTGCTCCTGGCTGCAAGATTGCCACTTGATG 120 

Qy 121 CCGCCAAACGATTTCATGATGTGCTGGGCAATGAAAGACCTTCTGCTTACATGAGGGAGC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 C CGC CAAAC GATTT CAT GAT GTGCT GGGCAAT GAAAGAC CT T CT G CTTACAT GAGGGAGC 180 

Qy 181 ACAAT CAAT TAAAT GGCT GGT CTT CT GAT GAAAAT GACT GGAAT GAAAAACT CTAC CC AG 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 ACAAT CAAT TAAAT GGCT GGT CTT CT GAT GAAAAT GACT GGAAT GAAAAACT CTAC C CAG 240 

Qy 241 TGTGGAAGCGGGGAGACATGAGGTGGAAAAACTCCTGGAAGGGAGGCCGTGTGCAGGCGG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I IJ I I I I 
Db 241 TGTGGAAGCGGGGAGACATGAGGTGGAAAAACTCCTGGAAGGGAGGCCGTGTGCAGGCGG 300 

Qy 301 TCCTGACCAGTGACTCACCAGCCCTCGTGGGCTCAAATATAACATTTGCGGTGAACCTGA 360 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 301 T CCT GACCAGT GACT CAC CAGCC CT C GT GGGCT CAAATATAAC ATT T GC GGT GAAC CT GA 360 

Qy 361 TAT T CC CT AGAT GC CAAAAG GAAGAT GC CAATG G CAAC AT AGT CT AT GAGAAGAACT GCA 420 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 361 TAT T C C CT AGAT GCCAAAAGGAAGAT GC CAATG G CAACAT AGT CT AT GAGAAGAACT GCA 420 

Qy 421 GAAAT GAGG CT GGT T T AT CT GCT GAT CCAT AT GTT T ACAACT G GACAGCAT GGT CAGAGG 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 421 GAAAT GAGGCT G GT TT AT CT GCT GAT CCAT AT GT TTACAACTGGAC AGCAT GGT CAGAGG 480 

Qy 481 ACAGT GAC GGGGAAAAT GGC ACC GGC CAAAGCCAT C ATAAC GT CT T CC CT GAT G GGAAAC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I 
Db 481 ACAGTGACGGGGAAAATGGCACCGGCCAAAGCCATCATAACGTCTTCCCTGATGGGAAAC 540 

Qy 541 CTTT T C CT CAC CAC CC CGGAT GGAGAAGAT GGAAT T TCAT CT AC GT CTT C CACACACTT G 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 541 CTT T T C CT CAC CAC CC CGGAT GGAGAAGAT G GAATTTCAT CT ACGT CTT C C ACACACT T G 600 



Qy 601 GT CAGT ATT T C CAGAAATT GGGACGAT GTTCAGT GAGAGTT T CT GTGAACACAGC CAAT G 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 GT CAGT ATT T C CAGAAAT T GGGAC GAT GTT CAGT GAGAGTTT CT GTGAACACAG C CAAT G 660 

Qy 661 T GACACT T GGG C CT CAACTCAT G GAAGT GACT GT CT ACAGAAGACAT GGAC G GGCATAT G 720 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 T GACACTT GGG C CT CAACTCAT GGAAGT GACT GT CT AC AGAAGACAT GGAC G GGCATAT G 720 

Qy 721 T T C C CAT CGCACAAGTGAAAGAT GT GTAC GT GGTAACAGAT CAGATT CCT GT GTT T GT GA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 T T C C CAT CGCACAAGTGAAAGAT GT GTAC GT GGTAACAGAT CAGATT CCT GT GTT T GT GA 780 

Qy 781 CTAT GT T C CAGAAGAAC GAT C GAAATT CATC CGACGAAAC CTT C CCAAAGAT CT C C CCAT 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 781 CTAT GT T C CAGAAGAAC GAT C GAAAT TCAT C C GACGAAAC CTT C C CAAAGAT CT C C CCAT 840 

Qy 841 TAT GTTT GAT GT CCT GATT CAT GAT C CT AGC CACTT CCT CAAT T ATT CTAC CAT TAACT A 900 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 841 TATGTTT GAT GTCCT GATTCAT GATCCTAGCCACTT CCT CAATTATT CTACCATTAACTA 900 

Qy 901 CAAGTGGAGCT T CG GGGATAAT ACT G GC CT GTTT GT TT C C AC CAAT CAT ACT GT GAAT C A 960 

I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 CAAGTGGAGCTTCGGGGATAATACTGGCCTGTTTGTTTCCACCAATCATACTGTGAATCA 960 

Qy 961 CACGTATGTGCTCAATGGAACCTTCAGCCTTAACCTCACTGTGAAAGCTGCAGCACCAGG 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 961 CACGTATGTGCTCAATGGAACCTTCAGCCTTAACCTCACTGTGAAAGCTGCAGCACCAGG 102 0 

Qy 1021 ACCTTGTCCGCCACCGCCACCACCACCCAGACCTTCAAAACCCACCCCTTCTTTAGGACC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 ACCTTGTCCGCCACCGCCACCACCACCCAGACCTTCAAAACCCACCCCTTCTTTAGGACC 1080 

Qy 1081 TGCT GGTGACAACCCCCT GGAGCTGAGTAGGATT CCTGAT GAAAACT GCCAGATTAACAG 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 TGCT GGT GACAACCCCCT GGAGCTGAGTAGGATT CCT GAT GAAAACT GCCAGATTAACAG 1140 

Qy 1141 ATAT GG.C CACTTT CAAGC CAC CAT CACAAT T GT AGAG GGAAT CTTAGAGGTTAACATCAT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 ATAT GGC CACT TT CAAGC CAC CAT CACAAT T GT AGAG GGAAT CTTAGAGGTTAACAT CAT 1200 

Qy 1201 CCAGATGACAGACGTCCTGATGCCGGTGCCATGGCCTGAAAGCTCCCTAATAGACTTTGT 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 CCAGATGACAGACGTCCTGATGCCGGTGCCATGGCCTGAAAGCTCCCTAATAGACTTTGT 1260 

Qy 1261 C GT GAC CT GC CAAGGGAG CAT T C C CACGGAGGT CTGT AC CAT CAT TT CT GAC C CCACCT G 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 C GT GAC CT G C CAAGGGAG CAT T C CCACGGAGGT CT GT AC CAT CAT TT CT GAC C C C ACCT G 1320 

Qy 1321 C GAGAT CAC C CAGAACACAGT CT GCAGC C CT GT GGAT GT GGAT GAGAT GT GT CTGCTGAC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 C GAGAT CAC C CAGAACACAGT CT GCAGCC CT GT GGAT GT GGAT GAGAT GT GT CT GCTGAC 1380 

Qy 1381 T GT GAGAC GAAC CTT CAAT GG GT CT GGGAC GT ACTGT GT GAAC CT CAC CCT G GG GGAT GA 1440 

I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1381 T GT GAGAC GAACCTTCAATGGGTCTGGGACGT ACTGT GT GAAC CTCACCCTGGGGGATGA 1440 

Qy 1441 CACAAGCCTGGCTCTCACGAGCACCCTGATTTCTGTTCCTGACAGAGACCCAGCCTCGCC 1500 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1441 CACAAGCCTGGCTCTCACGAGCACCCTGATTTCTGTTCCTGACAGAGACCCAGCCTCGCC 1500 

Qy 1501 TTTAAGGATGGCAAACAGTGCCCTGATCTCCGTTGGCTGCTTGGCCATATTTGTCACTGT 1560 

I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I 
Db 1501 TTTAAGGATGGCAAACAGTGCCCTGATCTCCGTTGGCTGCTTGGCCATATTTGTCACTGT 1560 

Qy 1561 GAT CT C C CT CT T GGTGT ACAAAAAACACAAGGAAT ACAAC CCAAT AGAAAAT AGT C CT GG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 GAT CT CC CT CT T GGTGTACAAAAAACACAAG GAAT ACAAC CCAAT AGAAAAT AGT C CT G G 1620 

Qy 1621 GAATGTGGTCAGAAGCAAAGGCCTGAGTGTCTTTCTCAACCGTGCAAAAGCCGTGTTCTT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 GAATGTGGTCAGAAGCAAAGGCCTGAGTGTCTTTCTCAACCGTGCAAAAGCCGTGTTCTT 1680 

Qy 1681 C C CGG GAAACCAG GAAAAGGAT C CG CT ACT CAAAAAC CAAGAAT T TAAAGGAGT TT CTT A 1740 

II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1681 C C CGGGAAAC CAG GAAAAGGAT C CG CT ACT CAAAAAC CAAGAAT T TAAAGGAGT TT CT T A 1740 

Qy 1741 AATTT C GAC CTT GTTT CT GAAGCT CACTTTT CAGT GCCAT T GAT GT GAGAT GTGCT G GAG 1800 

I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 AATTT C GAC CTT GT TT CT GAAGCT CACT TTT CAGT GC CAT T GAT GT GAGAT GT GCT GGAG 1800 

* 

Qy 1801 TGGCTATTAACCTTTTTTTCCTAAAGATTATTGTTAAATAGATATTGTGGTTTGGGGAAG 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1801 TGGCTATTAACCTTTTTTTCCTAAAGATTATTGTTAAATAGATATTGTGGTTTGGGGAAG 1860 

Qy 1861 T T GAATT T TTT ATAGGTTAAAT GT CAT T TTAGAGAT GGGGAGAGGGATT AT ACT G CAGG C 1920 

I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 T T GAATT T T TT ATAGGTTAAATGT CATT TTAGAGAT GGG GAGAGGGATT AT ACT GCAGG C 1920 

Qy 1921 AGCT T C AGC CAT GT T GTGAAACT GATAAAAGCAACTT AG CAAG GCT T CT T TT CATT ATT T 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 1921 AGCT T CAGC CAT GT TGT GAAACT GATAAAAG CAACTT AGCAAGGCTT CT TT T CATTAT T T 1980 

Qy 1981 TTTAT GTTT CACTTATAAAGT CTTAGGTAACTAGTAGGATAGAAACACTGT GTC CCGAGA 204 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1981 T T TAT GTTT CACT TAT AAAGT CT TAG GTAACTAGT AG GAT AGAAACACT GT GTCCCGAGA 2040 

Qy 2041 GTAAG GAGAGAAGCT ACTAT T GATT AGAGC CTAAC CCAGGTTAACT G CAAGAAGAGGC G G 2100 

II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2041 GTAAG GAGAGAAGCTACTAT T GAT T AGAGC CTAAC C CAGGTTAACT G CAAGAAGAGGC G G 2100 

Qy 2101 GAT ACTTT C AGCT T T C CAT GTAACT GT ATGC ATAAAGC CAAT GTAGT CCAGTTT CTAAGA 2160 

I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2101 GAT ACT T T CAG CTT T C CAT GTAACT GT AT G CAT AAAGC CAAT GTAGT CCAGT TT CTAAGA 2160 

Qy 2161 T CAT GT T CCAAGCTAACT GAAT C C CACTT CAAT ACACACT CAT GAACTC CT GAT GGAACA 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 T CAT GT T CCAAGCTAACT GAAT C C CACTT CAAT AC ACACT CAT GAACT C CT GAT GGAACA 2220 

Qy 2221 ATAACAGGCCCAAGCCT GTGGTATGATGTGCACACTT GCTAGACT CAGAAAAAATACTAC 2280 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 2221 ATAACAGGCCCAAGCCT GTGGTAT GATGTGCACACTT GCTAGACT CAGAAAAAATACTAC 2280 

Qy 2281 TCTCATAAATGGGTGGGAGTATTTTGGTGACAACCTACTTTGCTTGGCTGAGTGAAGGAA 234 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 



Db 



2281 



TCTCATAAATGGGTGGGAGTATTTTGGTGACAACCTACTTTGCTTGGCTGAGTGAAGGAA 2340 



Db 



2341 T GAT ATT CAT AT ATT CATTT ATT CCATGGACATTT AGT T AGT GCT T TTTATATAC C AGGC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I 

2341 T GAT ATT CAT AT ATT CAT T T ATT C CATGGACAT TT AGT TAGT GCTT TTTATATAC CAGGC 2400 



Qy 



2401 AT GAT GCT GAGTGACACT CT T GT GTATATT T C CAAATT TTT GTATAGT C GCT GCAC AT AT 24 60 




Db 



2401 AT GAT GCT GAGTGACACT CT T GT GTATATTT C CAAATT TTT GTATAGT C GCT GCACAT AT 24 60 



Db 



2461 TTGAAATCAAAATATTAAGACTTTCCAAAAATTTGGTCCCTGGTTTTTCATGGCAACTTG 2520 

I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
2461 TTGAAATCAAAATATTAAGACTTTCCAAAAATTTGGTCCCTGGTTTTTCATGGCAACTTG 2520 



Qy 



Db 



2521 ATCAGTAAGGATTT CCCCT CT GTTT GGAACTAAAACCATTTACTATATGTTAGACAAGAC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2521 AT CAGTAAGGATTT C C CCT CT GTT T GGAACTAAAAC CATTTACTAT AT GT T AGACAAGAC 2580 



Qy 



Db 




Qy 



2641 AAAAAAAAAAAAAAAAAAAAA 2661 




Db 



2641 AAAAAAAAAAAAAAAAAAAAA 2661 



RESULT 2 
ADQ22838 

ID ADQ22838 standard; DNA; 2845 BP. 
XX 

AC ADQ22838; 
XX 

DT 26-AUG-2004 (first entry) 
XX 

DE Human soft tissue sarcoma-upregulated DNA - SEQ ID 5658. 



KW soft tissue sarcoma; cytostatic; gene therapy; vaccine; screening; human; 

KW ds. 

XX 

OS Homo sapiens . 
XX 

PN WO2004048938-A2. 
XX 

PD 10-JUN-2004. 
XX 

PF 26-NOV-2003; 2003WO-US038 193 . 
XX 

PR 26-NOV-2002; 2002US-0429739P . 
XX 

PA (PROT-) PROTEIN DESIGN LABS INC. 

XX 

PI Aziz N, Ginsburg WM, Zlotnik A; 
XX 

DR WPI; 2004-441208/41. 



PT Early detection of soft tissue sarcoma comprises determining expression 



XX 



XX 



PT of a gene in a first soft tissue sample and a normal soft tissue sample 

PT and comparing the gene expression, also useful in treating soft tissue 

PT sarcoma. 
XX 

PS Example 2; SEQ ID NO 5658; 210pp; English. 
XX 

CC The invention relates to a novel method for detecting soft tissue sarcoma 

CC which comprises obtaining a first soft tissue sample from an individual 

CC and a normal soft tissue sample from the same or different individual, 

CC determining the expression of a gene in both samples and comparing the 

CC expression of the gene in both soft tissue samples, where a higher level 

CC of protein expression in the first soft tissue sample indicates the 

CC presence of soft tissue sarcoma. The method of the invention has 

CC cytostatic applications and may be useful for detecting soft tissue 

CC sarcoma, possibly via gene therapy or vaccine production. The nucleic 

CC acid sequences may be useful in diagnostic and screening applications. 

CC The current sequence is that of a human soft tissue sarcoma-upregulated 

CC DNA of the invention. The current sequence is not shown within the 

CC specification per se but was submitted in CD format by the inventor. 
XX 

SQ Sequence 2845 BP; 873 A; 617 C; 614 G; 741 T; 0 U; 0 Other; 



Query Match 96.6%; Score 2571.2; DB 12; Length 2845; 

Best .Local Similarity 99.2%; Pred. No. 0; 

Matches 2615; Conservative 0; Mismatches 18; Indels 3; Gaps 3; 



Qy 


28 


AACCTTGGTGCCTGCGTCCGTGAGAATTCAGCATGGAATGTCTCTACTATTTCCTGGGAT 


87 


Db 


140 


1 1 1 1 1 1 I 1 1 M 1 M M 1 1 1 1 1 M 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 ! 1 1 I 

AC CTT GAGT GC CT GC GT C C GT GAGAAT T CAGCAT GGAAT GT CT CTACT AT TT C CT GGGAT 


199 


Qy 


88 


TTCTGCTCCTGGCTGCAAGATTGCCACTTGATGCCGCCAAACGATTTCATGATGTGCTGG 


147 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 M 1 1 1 1 1 




Db 


200 


TTCTGCTCCTGGCTGCAAGATTGCCACTTGATGCCGCCAAACGATTTCATGATGTGCTGG 


259 


Qy 


148 


G CAAT GAAAGACCTT CT GCT T ACAT GAG GGAG CACAAT CAAT TAAAT GG CT GGT CT T CT G 


207 






1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


260 


GCAATGAAAGACCTTCTGCTTACATGAGGGAGCACAATCAATTAAATGGCTGGTCTTCTG 


319 


Qy 


208 


AT GAAAAT GACTG GAAT GAAAAACT CTAC C CAGT GT GGAAGC G G GGAGACAT GAGGT GGA 


267 






M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II I 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


320 


AT GAAAAT GACTGGAAT GAAAAACT CTACCCAGT GTGGAAGCGGGGAGACAT GAGGT GGA 


379 


Qy 


268 


AAAACTCCTGGAAGGGAGGCCGTGTGCAGGCGGTCCTGACCAGTGACTCACCAGCCCTCG 


327 






1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


380 


AAAACTCCTGGAAGGGAGGCCGTGTGCAGGCGGTCCTGACCAGTGACTCACCAGCCCTCG 


439 


Qy 


328 


T GG GCT CAAATATAACAT T T GC GGT GAACCT GAT AT TC CCTAGAT G C CAAAAGGAAGAT G 


387 






1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 




Db 


440 


T G GGCT CAAAT ATAACATTT GC GGT GAAC CT GAT ATTC CCTAGATGC CAAAAGGAAGAT G 


499 


Qy 


388 


C CAAT GGCAACAT AGT CTATGAGAAGAACT GCAGAAAT GAGGCT GGT TTAT CT GCT GAT C 


447 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I 1 I I I I I I I I I I I | I | | | | | | | | | | | 1 1 




Db 


500 


CCAAT GGCAACAT AGTCTATGAGAAGAACT GCAGAAAT GAGGCTGGTTTAT CTGCT GATC 


559 


Qy 


448 


CAT AT GTT TACAACT GGACAGCAT GGT CAGAGGAC AGT GACGGGGAAAAT GGCAC C G GC C 


507 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 l 




Db 


560 


CATATGTTTACAACTGGACAGCATGGTCAGAGGACAGTGACGGGGAAAATGGCACCGGCC 


619 



Qy 508 AAAGCCATCATAACGTCTTCCCTGATGGGAAACCTTTTCCTCACCACCCCGGATGGAGAA 567 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 620 AAAGC CAT CATAACGT CTT C C CT GAT GGGAAAC CT T TT CCT CACCACC CC GGAT GGAGAA 679 

Qy 568 GAT GGAAT TT CAT CT ACGT CT T C CACACACTT GGT CAGTATT T CCAGAAATT GGGAC GAT 627 

I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I 1 I I 

Db 680 GAT GGAAT TT CAT CT ACGT CT T C CACACACTTGGT CAGTATT T CCAGAAAT T GGGAC GAT 739 

Qy 628 GTT CAGTGAGAGTTT CTGT GAACACAGCCAATGTGACACTTGGGCCT CAACTCATGGAAG 687 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 740 GTT CAGTGAGAGTTT CTGT GAACACAGCCAATGTGACACTTGGGCCT CAACTCATGGAAG 799 

Qy 688 TGACT GTCTACAGAAGACATGGACGGGCATATGTT CCCATCGCACAAGTGAAAGAT GTGT 747 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 800 TGACTGTCTACAGAAGACATGGACGGGCATATGTTCCCATCGCACAAGTGAAAGATGTGT 859 

Qy 748 AC GT GGT AACAGAT CAGAT T C CT GT GT T T GT GACT AT GT T C C AGAAGAAC GAT C GAAAT T 807 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 860 ACGT GGTAACAGATCAGATT CCT GTGTTT GTGACTAT GTT CCAGAAGAACGATCGAAATT 919 

Qy 808 CAT C C GAC GAAAC CT T C C - CAAAGAT CT C CC CATTAT GTT T GAT GT C CT GAT T CAT GAT C 866 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 920 CAT C C GAC GAAAC CT T C CT CAAAGAT CT C C C CATTAT GTT T GAT GT C CT GAT T CAT GATC 979 

Qy 867 CTAGCCACTTCCTCAATTATTCTACCATTAACTACAAGTGGAGCTTCGGGGATAATACTG 926 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 980 CT AGC CACT T C CT CAATT AT T CT AC CATTAACTACAAGTGGAGCT T C G GGGATAAT ACTG 1039 

Qy 927 G CCT GT TT GT T TC CAC CAAT CAT ACT GT GAAT CACAC GT AT GT GCT CAAT GGAACCT T CA 98 6 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1040 GCCTGTTTGTTTC CAC CAAT CAT ACT GT GAAT CACAC GTAT GT GCT CAAT GGAAC CT T CA 1099 

Qy 987 G CCTTAACCT CACT GT GAAAGCT GCAGCAC CAG GAC CTT GT C C GC CAC C GC CAC CAC CAC 1046 

I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1100 GCCT TAAC CT CACT GT GAAAGCT GCAGCAC CAGGAC CT T GT C C GC CAC CGC CAC CAC CAC 1159 

Qy 1047 CCAGACCTTCAAAACCCACCCCTTCTTTAGGACCTGCTGGTGACAACCCCCTGGAGCTGA 1106 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1160 CCAGACCTTCAAAACCCACCCCTTCTTTAGGACCTGCTGGTGACAACCCCCTGGAGCTGA 1219 

Qy 1107 GTAG GATT C CT GAT GAAAACT GC CAGATTAACAGAT AT GGC CACT TT CAAGCCAC CAT CA 1166 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1220 GTAGGATT C CT GAT GAAAACT GC CAGATTAACAGAT AT GGC CACTT T CAAGC CAC CAT CA 1279 

Qy 1167 CAAT T GTAGAG GGAAT CTT AGAGGT TAACAT CAT C CAGAT GACAGAC GT C CT GAT GC C GG 1226 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1280 CAATT GTAGAGGGAAT CT TAGAGGTTAACAT CAT C CAGAT GACAGACGTC CT GAT GC C GG 1339 

Qy 1227 TGCCATGGCCTGAAAGCTCCCTAATAGACTTTGTCGTGACCTGCCAAGGGAGCATTCCCA 12 86 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 1340 T GC CAT GGCCT GAAAGCT C C CTAAT AGACT T T GT C GT GACCT GCCAAGGGAGCAT T C C CA 1399 

Qy 1287 C GGAGGTCT GT AC CAT CAT TT CT GAC CCCAC CT GC GAGAT CAC C CAGAACACAGT CT GCA 134 6 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1400 C GGAGGT CT GTAC CAT CATT T CT GAC CC CACCT GCGAGAT CAC C CAGAACACAGT CT G CA 1459 



Qy 1347 GCCCTGTGGATGTGGATGAGATGTGTCTGCTGACTGTGAGACGAACCTTCAATGGGTCTG 1406 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1460 GCCCTGTGGATGTGGATGAGATGTGTCTGCTGACTGTGAGACGAACCTTCAATGGGTCTG 1519 

Qy. 1407 GGAC GTACT GT GT GAAC CT CAC C CT G GG GGAT GACACAAG CCT GGCT CT CAC GAGCAC C C 14 66 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1520 GGACGTACTGTGTGAACCTCACCCTGGGGGATGACACAAGCCTGGCTCTCACGAGCACCC 1579 

Qy 1467 TGATTTCTGTTCCTGACAGAGACCCAGCCTCGCCTTTAAGGATGGCAAACAGTGCCCTGA 1526 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1580 T GATTT CT GTT C CT GAC AGAGAC C CAGC CT C GC CTTTAAGGAT G GCAAACAGT GCC CT GA 1639 

Qy 1527 TCTCCGTTGGCTGCTTGGCCATATTTGTCACTGTGATCTCCCTCTTGGTGTACAAAAAAC 1586 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1640 TCTCCGTTGGCTGCTTGGCCATATTTGTCACTGTGATCTCCCTCTTGGTGTACAAAAAAC 1699 

Qy 1587 ACAAGGAAT ACAAC CCAAT AGAAAAT AGT CCT GGGAAT GT GGT C AGAAGCAAAGGC CT GA 1646 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1700 ACAAGGAAT ACAAC C CAAT AGAAAAT AGT C CT GGGAAT GT GGT C AGAAGCAAAGGC CT GA 1759 

Qy 1647 GTGTCTTTCTCAACCGTGCAAAAGCCGTGTTCTTCCCGGGAAACCAGGAAAAGGATCCGC 1706 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1760 GTGTCTTTCTCAACCGTGCAAAAGCCGTGTTCTTCCCGGGAAACCAGGAAAAGGATCCGC 1819 

Qy 1707 TACTCAAAAACCAAGAATTTAAAGGAGTTTCTTAAATTTCGACCTTGTTTCTGAAGCTCA 17 66 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1820 TACTCAAAAACCAAGAATTTAAAGGAGTTTCTTAAATTTCGACCTTGTTTCTGAAGCTCA 1879 

Qy 1767 CT TT T CAGT GC CAT TGAT GT GAGAT GT G CT G GAGT GGCT ATTAAC CT TTTT T T C CTAAAG 1826 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1880 CTTTTCAGTGCCATTGATGTGAGATGTGCTGGAGTGGCTATTAACCTTTTTTTCCTAAAG 1939 

Qy 1827 ATTAT T GTTAAAT AGAT AT T GT GGT T T GGGGAAGTTGAATTTT T TAT AG GTTAAAT GT CA 1886 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1940 ATTATT GTTAAAT AGAT ATT GTGGTTTGGGGAAGTTGAATTTTTTATAGGTTAAAT GT CA 1999 

Qy 1887 TT TT AGAGAT GGGGAGAGGGATT ATACT GCAGGCAGCTT CAGCCAT GTT GT GAAACT GAT 194 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2000 TTTTAGAGATGGGGAGAGGGATTATACT GCAGGCAGCTT CAGC CAT GTT GT GAAACTGAT 2059 

Qy 1947 AAAAGCAACTTAGCAAGGCTTCTTTTCATTATTTTTTATGTTTCACTTATAAAGTCTTAG 2006 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2060 AAAAGCAACTTAGCAAGGCTTCTTTTCATTATTTTTTATGTTTCACTTATAAAGTCTTAG 2119 

Qy 2007 GTAACT AGT AG GAT AGAAACACT GT GTC CC GAGAGTAAGGAGAGAAG CTACTAT T GATT A 2066 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2120 GTAACT AGT AGGAT AGAAACACT GT GTC CC GAGAGTAAGGAGAGAAGCT ACTATT GAT T A 2179 

Qy 2067 GAGC CTAAC C CAGGTTAACTG CAAGAAGAGGC G GGAT ACT TT CAG CTTT C CAT GTAACT G 2126 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2180 GAGCCTAACCCAGGTTAACTGCAAGAAGAGGCGGGATACTTTCAGCTTTCCATGTAACTG 2239 

Qy 2127 TAT GCATAAAG C CAAT GT AGT CCAGT TT CTAAGAT CAT GT T C CAAGCTAACT GAAT C C CA 2186 

I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2240 TATGCATAAAGCCAATGTAGTCCAGTTT CTAAGAT CAT GTTCCAAGCTAACT GAATCCCA 2299 

Qy 2187 CTTCAATACACACTCATGAACTCCTGATGGAACAATAACAGGCCCAAGCCTGTGGTATGA 224 6 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 2300 CTT CAATACACACT CAT GAACT C CT GAT GGAACAATAACAGGCCCAAGC CT GT GGT AT GA 2359 

Qy 2247 T GT GCACACT TGCT AGACT CAGAAAAAATACTACT CT CATAAAT GGGT GG GAGTAT TTT G 2306 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2360 TGT GCACACTTGCTAGACT CAGAAAAAATACTACTCTCATAAAT GGGT GGGAGTATTTTG 2419 

Qy 2307 GT GACAAC CT ACT TTGCTTGGCT GAGTGAAGGAAT GAT AT T CAT AT AT T CATTTAT T C CA 2366 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 2420 GT GACAAC CT ACT TTGCTTGGCT GAGTGAAGGAAT GAT AT T CAT AT AT T CATTTATT C CA 2479 

Qy 2367 T GGACAT TT AGTTAGT GCT TTT T ATATACCAGG CAT GAT GCT GAGT GACACTCTT GT GTA 2426 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 80 T GGACAT T T AGTTAGT GCTTT T T ATATACCAGG CAT GAT GCT GAGT GACACTCTT GT GTA 2539 

Qy 2427 T AT TT C CAAATTT TT GT ATAGT C GCT GCACAT AT TT GAAAT CAAAAT AT TAAGACTT T C C 2486 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 2540 T ATTT C CAAATT T TT GT ACAGT C GCT GCAC AT ATTT GAAAT C- ATATATTAAGACTT T C C 2598 

Qy 2487 AAAAATTTGGTCCCTGGTTTTTCATGGCAACTTGATCAGTAAGGATTTCCCCTCTGTTTG 254 6 

III II II I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I II I I I I I I I I I I I I I 
Db 2599 AAAGAT GAGGT C C CT GGTTTT T C AT GGCAACTT GAT CAGTAAGGAT TT C AC CT CT GT T T G 2658 

Qy 2547 GAACTAAAACCATTTACTATATGTTAGACAAGACATTTTTTTTTTTTCCTTCCTGAAAAA 2606 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I II 
Db 2659 TAACTAAAACCATCTACTATATGTTAGACATGACATTCTTTTTCTCTCCTTCCTGAAAAA 2718 

Qy 2607 - AAAAT GAGGGAAGAGACAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 2661 

III II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I II I I 
Db 2719 TAAAGTGTGGGAAGAGACAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 2774 
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Total number of hits satisfying chosen parameters: 



2405568 



Minimum DB seq length: 0 

Maximum. DB seq length: 2000000000 



Post-processing: Minimum Match 0% 

Maximum Match 100% 



Listing first 45 summaries 



Database : Issued_Patents_NA: * 

1 : /cgn2_6/ptodata/l/ina/5A_COMB. seq: * 

2 : /cgn2_6/ptodata/l/ina/5B_COMB. seq: * 

3 : /cgn2_6/ptodata/l/ina/6A_COMB. seq: * 

4 : /cgn2_6/ptodata/l/ina/6B_COMB. seq: * 

5: /cgn2_6/ptodata/l/ina/PCTUS_COMB.seq: * 

6 : / cgn2_6/ptodata/l/ina/backf ilesl .seq: * 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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RESULT 1 

US-09-985-799-91 

; Sequence 91, Application US/09985799 
; Patent No. RE38392 

GENERAL INFORMATION: 

APPLICANT: THOMPSON, Timothy C. 

TITLE OF INVENTION: METHOD FOR IDENTIFYING METASTATIC SEQUENCES 
NUMBER OF SEQUENCES: 175 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: BAKER & BOTTS, L.L.P. 
; STREET: 1299 Pennsylvania Avenue, N.W. 

; CITY: Washington 

; STATE: DC 

; COUNTRY: USA 

; ZIP: 20004-2400 

COMPUTER READABLE FORM: 

MEDIUM TYPE: Diskette 
COMPUTER: IBM Compatible 
OPERATING SYSTEM: DOS 
SOFTWARE: FastSEQ Version 1.5 
CURRENT APPLICATION DATA: 
; APPLICATION NUMBER: US/09/985,799 

FILING DATE: 06-No. RE38392-2001 
CLASSIFICATION: <Unknown> 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US/ 08/594 , 031 
FILING DATE: 30-JAN-1996 
; APPLICATION NUMBER: 60/006,838 

; FILING DATE: 16-NOV-1995 

; ATTORNEY/AGENT INFORMATION: 

; NAME: Remenick, James 

; REGISTRATION NUMBER: 36,902 

; REFERENCE/ DOCKET NUMBER: 0A1 4 6-0110 

TELECOMMUNICATION INFORMATION: 
TELEPHONE: 202-639-7700 
; TELEFAX: 202-639-7890 

; TELEX: <Unknown> 

INFORMATION FOR SEQ ID NO: 91: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 2669 base pairs 
TYPE: nucleic acid 
STRANDEDNESS: single 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA 
; HYPOTHETICAL: NO 



ANTI-SENSE: NO 

FRAGMENT TYPE: <Unknown> 
; ORIGINAL SOURCE: 

SEQUENCE DESCRIPTION: SEQ ID NO: 91: 
US-09-985-799-91 

Query Match 95.7%; Score 2547.8; DB 1; Length 2669; 

Best Local Similarity 99.2%; Pred. No. 0; 

Matches 2591; Conservative 0; Mismatches 17; Indels 3; Gaps 3; 

Qy 28 AACCTTGGTGCCTGCGTCCGTGAGAATTCAGCATGGAATGTCTCTACTATTTCCTGGGAT 87 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 60 ACCTTGAGTGCCTGCGTCCGTGAGAATTCAGCATGGAATGTCTCTACTATTTCCTGGGAT 119 

Qy 88 TTCTGCTCCTGGCTGCAAGATTGCCACTTGATGCCGCCAAACGATTTCATGATGTGCTGG 147 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I 
Db 120 TTCTGCTCCTGGCTGCAAGATTGCCACTTGATGCCGCCAAACGATTTCATGATGTGCTGG 179 

Qy 148 GCAAT GAAAGAC CTT CT G CT T ACAT GAGG GAGCACAAT CAAT TAAAT GGCT GGT CT T CT G 207 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 180 GCAAT GAAAGAC CT T CT GCT TACAT GAGG GAGCACAAT CAAT TAAAT GG CT GGT CTT CT G 239 

Qy 208 ATGAAAATGACT GGAAT GAAAAACT CTACCCAGT GT GGAAGCGGGGAGACATGAGGT GGA 267 

I I I I I I I I I I I II I I I II I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 240 AT GAAAAT GACT GGAAT GAAAAACT CTAC C CAGT GT GGAAGC GGGGAGACAT GAGGT GGA 299 

Qy 268 AAAACTCCTGGAAGGGAGGCCGTGTGCAGGCGGTCCTGACCAGTGACTCACCAGCCCTCG 327 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 300 AAAACTCCTGGAAGGGAGGCCGTGTGCAGGCGGTCCTGACCAGTGACTCACCAGCCCTCG 359 

Qy 328 T G G G CT CAAATATAACATTT G C GGT GAAC CT GAT ATTC C CT AGAT GC CAAAAGGAAGAT G 387 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 360 T GG G CT CAAATATAACATTT G C GGT GAAC CT GAT ATTC C CT AGATG C CAAAAGGAAGAT G 419 

Qy 388 CCAAT GGCAACAT AGT CT AT GAGAAGAACT GCAGAAAT GAG GCT GGT T T AT CT GCT GAT C 447 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 420 C CAAT GGCAACAT AGT CT AT GAGAAGAACT G CAGAAAT GAG GCT GGTTT AT CT G CT GAT C 479 

Qy 448 CATATGTTTACAACTGGACAGCATGGTCAGAGGACAGTGACGGGGAAAATGGCACCGGCC 507 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 480 CAT AT GT T T ACAACT GGACAGCATGGT CAGAGGACAGT GAC G GG GAAAAT GG C AC C GGC C 539 

Qy 508 AAAGC CAT CATAACGT CT TC C CT GAT GGGAAAC CTTTT C CT CAC CAC CC C GGAT GGAGAA 567 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 540 AAAGC CAT CATAACGT CT TCCCT GAT GGGAAAC CTTTT C CT CAC CAC C C C GGAT G GAGAA 599 

Qy 568 GAT G GAAT TT CAT CTAC GT CT T C CACACACTT GGT CAGT AT T T C CAGAAAT T GGGACGAT 627 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 600 GAT GGAATTT CAT CTAC GT CT T C CACACACT T GGT CAGT AT TT C CAGAAAT T GGGAC GAT 659 

Qy 628 GT T CAGT GAGAGTTT CT GT GAACACAGC CAATGT GACACTT GGG CCT CAACT CAT GGAAG 687 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 660 GTTCAGTGAGAGTTTCTGTGAACACAGCCAATGTGACACTTGGGCCT CAACT CAT GGAAG 719 



Qy 

Db 



688 T GACT GT CT ACAGAAGACAT GGACGGGCAT AT GTT C C CATC GCACAAGT GAAAGAT GT GT 747 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
720 TGACT GT CT AC AGAAGACAT GGACGGGCAT AT GT T C CC AT C G CACAAGT GAAAGAT GTGT 779 



Qy 74 8 AC GTGGTAACAGAT CAGATT C CT GT GTTT GTGACTAT GT T C CAGAAGAAC GAT CGAAATT 807 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 780 ACGT GGTAACAGAT CAGATT CCT GT GTTT GTGACTAT GTT C CAGAAGAAC GAT CGAAATT 839 

Qy 808 CATCCGACGAAACCTTCC - CAAAGAT CT CCCCATTATGTTT GATGT CCT GATTCATGAT C 866 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 840 CATCCGACGAAACCTTCCTCAAAGATCTCCCCATTATGTTTGATGTCCT GATTCATGAT C 899 

Qy 867 CT AGC C ACTT C CT CAATT ATT CTAC CAT TAACTACAAGT GGAGCTT CGGGGATAAT ACT G 926 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 900 CTAGCCACTT CCTCAATTATT CTAC CATTAACTACAAGT GGAGCTT CGGGGATAATACT G 959 

Qy 927 GCCTGTT T GT TT CCAC CAATCAT ACT GT GAAT CACAC GT AT GT GCT CAAT GGAAC CTT C A 986 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 960 GC CTGTTT GTTT CCAC CAAT CAT ACT GT GAAT CACAC GTAT GT GCT CAAT GGAAC CTT CA 1019 

Qy 987 GCCTTAACCTCACTGTGAAAGCTGCAGCACCAGGACCTTGTCCGCCACCGCCACCACCAC 104 6 

I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I 
Db 1020 GCCTTAACCTCACTGTGAAAGCTGCAGCACCAGGACCTTGTCCGCCACCGCCACCACCAC 1079 

Qy 1047 CCAGACCTTCAAAACCCACCCCTTCTTTAGGACCTGCTGGTGACAACCCCCTGGAGCTGA 1106 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 108 0 CCAGACCTTCAAAACCCACCCCTTCTTTAGGACCTGCTGGTGACAACCCCCTGGAGCTGA 1139 

Qy 1107 GTAGGATT C CT GAT GAAAACT GC CAGAT TAACAGAT AT G G CCACTT TCAAG C CAC CAT CA 1166 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1140 GTAGGAT T C CT GAT GAAAACT GC CAGATTAAC AGAT AT GGC CACTT T CAAGC CAC CAT CA 1199 

■ 

Qy 1167 CAATT GTAGAGGGAAT CTTAGAGGTTAACAT CATCCAGAT GACAGACGT CCT GATGCCGG 1226 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1200 CAATT GT AGAGG GAAT CT T AGAGGT TAACAT CAT C CAGAT GACAGACGT C CT GAT GC C GG 1259 

Qy 1227 TGCCATGGCCTGAAAGCTCCCTAATAGACTTTGTCGTGACCTGCCAAGGGAGCATTCCCA 1286 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 60 TGCCATGGCCTGAAAGCTCCCTAATAGACTTTGTCGTGACCTGCCAAGGGAGCATTCCCA 1319 

Qy 1287 CGGAGGT CTGTACCATCATTT CT GACCCCACCTGC GAGAT CACCCAGAACACAGT CT GCA 1346 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1320 C GGAGGTCTGTACCAT CATTT CTGACCCCACCTGCGAGAT CACCCAGAACACAGT CT GCA 137 9 

Qy 1347 G CC CT GT GGAT GT GGAT GAGATGT GT CT GCT GACT GT GAGAC GAAC CT T CAAT GGGT CT G 1406 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1380 GCC CT GT GGAT GT GGAT GAGAT GT GT CT G CT GACT GT GAGAC GAAC CT T CAAT GGGT CT G 1439 

Qy 1407 GGACGTACTGTGTGAACCTCACCCTGGGGGATGACACAAGCCTGGCTCTCACGAGCACCC 1466 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 144 0 GGACGTACTGTGTGAACCTCACCCTGGGGGATGACACAAGCCTGGCTCTCACGAGCACCC 1499 

Qy 1467 T GATTT CT GT TC CT GACAGAGAC C CAGC CT C G C CTTTAAG GATG GCAAACAGT GCC CT GA 1526 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1500 T GATT T CT GTT C CT GACAGAGAC C CAGC CT C GC CT TTAAGGAT GGCAAACAGT GC C CT GA 1559 

Qy 1527 TCTCCGTTGGCTGCTTGGCCATATTTGTCACTGTGATCTCCCTCTTGGTGTACAAAAAAC 1586 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1560 TCTCCGTTGGCTGCTTGGCCATATTTGTCACTGTGATCTCCCTCTTGGTGTACAAAAAAC 1619 



Qy 1587 ACAAGGAAT ACAAC CCAAT AGAAAAT AGT C CT GGGAAT GT GGT CAGAAGCAAAG GCCT GA 164 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1620 ACAAGGAAT ACAAC C CAAT AGAAAAT AGT CCT GGGAAT GT G GT CAGAAG CAAAGGC CT GA 1679 

Qy 1647 GTGTCTTTCTCAACCGTGCAAAAGCCGTGTTCTTCCCGGGAAACCAGGAAAAGGATCCGC 1706 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1680 GTGTCTTTCTCAACCGTGCAAAAGCCGTGTTCTTCCCGGGAAACCAGGAAAAGGATCCGC 1739 

Qy 1707 TACT CAAAAACCAAGAATT TAAAGGAGT TT CTTAAAT TT CGAC CT TGT T T CT GAAGCT CA 1766 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1740 TACT CAAAAAC CAAGAATT TAAAGGAGT TT CT TAAAT T T C GAC CT TGT TT CT GAAGCT CA 1799 

Qy 17 67 CTTTTCAGTGCCATTGATGTGAGATGTGCTGGAGTGGCTATTAACCTTTTTTTCCTAAAG 1826 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1800 CTTTTCAGTGCCATTGATGTGAGATGTGCTGGAGTGGCTATTAACCTTTTTTTCCTAAAG 1859 

Qy 1827 AT T ATT GTTAAAT AGAT ATT GT GGT TT G GGGAAGTT GAATTTTTT AT AG GTTAAAT GT CA 1886 

I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1860 ATT ATT GTTAAAT AGAT AT T GT GGT TT G GG GAAGTT GAATT TT TT AT AGGTTAAAT GT C A 1919 

Qy 1887 T TTT AGAGAT GG G GAGAGG GATT AT ACT GCAGGCAG CTT CAGC CAT GTT GT GAAACT GAT 194 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1920 TTTTAGAGAT GGGGAGAGGGATTATACT GCAGGCAGCTT CAGCCATGTT GTGAAACTGAT 1979 

Qy 1947 AAAAGCAACTTAGCAAGGCTTCTTTTCATTATTTTTTATGTTTCACTTATAAAGTCTTAG 2006 

I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1980 AAAAGCAACTTAGCAAGGCTTCTTTTCATTATTTTTTATGTTTCACTTATAAAGTCTTAG 2039 

Qy 2007 GTAACT AGTAGGAT AGAAACACT GT GT C CC GAGAGTAAG GAGAGAAG CTACTAT T GAT TA 2066 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2040 GTAACTAGTAGGAT AGAAACACT GT GT C CCGAGAGTAAGGAGAGAAGCT ACT AT TGATTA 2099 

Qy 2067 GAGC CT AAC C C AG GT TAACT GCAAGAAGAGGC GGGAT ACT T T CAGCT TT C CAT GTAACTG 2126 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 2100 GAGCCTAACCCAGGTTAACTGCAAGAAGAGGCGGGATACTTTCAGCTTTCCAT GTAACTG 2159 

Qy 2127 TAT G CAT AAAGC CAAT GTAGT C CAGT T T CTAAGAT CAT GTT CCAAGCTAACT GAAT CC CA 2186 

II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2160 T AT GCATAAAGC CAATGTAGT C CAGT T T CTAAGAT CAT GT T CCAAGCTAACT GAAT C C CA 2219 

Qy 2187 CTT CAAT ACACACT CATGAACT CCT GATGGAACAATAACAGGCCCAAGCCT GTGGTATGA 2246 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2220 CTT CAAT ACACACT CAT GAACT C CT GAT GGAACAATAACAG GC CCAAGC CT GT GGT AT GA 227 9 

Qy 2247 TGTGCACACTT GCTAGACT CAGAAAAAATACTACTCT CATAAATGGGTGGGAGTATTTT G 2306 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2280 T GTG CACACT T G CT AGACT CAGAAAAAAT ACTACT CT CATAAATG GGT G GGAGT AT TTT G 2339 

Qy 2307 GT GACAACCTACTTT GCTT GGCT GAGTGAAGGAATGATATTCATATATT CATTTATTCCA 2366 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 2340 GT GACAAC CTACTTTGCTT GGCTGAGTGAAGGAAT GATATT CATATATTCATTTATT CCA 2399 

Qy 2367 T GGACATT T AGTT AGTG CTT T TT ATATACCAGGCAT GAT GCT GAGT GACACT CTTGT GT A 2426 

II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 24 00 TGGACATTTAGTTAGTGCTTTTTATATACCAGGCATGATGCTGAGTGACACTCTTGTGTA 2459 

Qy 2427 T ATT TCCAAATT T TT GT AT AGT C GCT GCACATAT T T GAAAT CAAAAT AT TAAGACT TT C C 2486 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 2460 T ATTT C CAAATT TT TGT AT AGT C GCT GCACAT ATT TGAAATC - AT ATATT AAGACTTT C C 2518 

Qy 2487 AAAAATTTGGTCCCTGGTTTTTCATGGCAACTTGATCAGTAAGGATTTCCCCTCTGTTTG 254 6 

III II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2519 AAAGAT GAGGT CCCTGGTTTTT CAT GGCAACTT GATCAGTAAGGAT T T CAC CTCT GTT T G 2578 

Qy 2547 GAACTAAAACCATTTACTATATGTTAGACAAGACATTTTTTTTTTTTCCTTCCTG7VAAAA 2606 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2579 TAACTAAAACCAT CTACT AT AT GTTAGACAT GACATT CTT TTT CT CT C CT T C CT GAAAAA 2638 

Qy 2607 - AAAAT GAGGGAAGAGACAAAAAAAAAAAAA 2636 

III II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2639 T AAAGT GT G G GAAGAGACAAAAAAAAAAAAA 2669 
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RESULT 1 
US-10-039-272-1 

Sequence 1, Application US/10039272 
Publication No. US20020168653A1 
GENERAL INFORMATION: 
APPLICANT: RAMESHWAR, Pranela 

TITLE OF INVENTION: HEMATOPOIETIC GROWTH FACTOR INDUCIBLE NEUROKININ-TYPE 
FILE REFERENCE: 267/033 University of Medicine & Dentistry of New Jersey 
CURRENT APPLICATION NUMBER: US/10/039 , 272 
CURRENT FILING DATE: 2001-10-20 
PRIOR APPLICATION NUMBER: US 60/241,881 
PRIOR FILING DATE: 2000-10-20 
NUMBER OF SEQ ID NOS : 2 
SOFTWARE: Patent In version 3.1 
SEQ ID NO 1 
LENGTH: 2661 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-10-039-272-1 

Query Match 100.0%; Score 2661; DB 13; Length 2661; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2661; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 CGGCACGAGGGCCCAGAGGAATAAGTTAACCTTGGTGCCTGCGTCCGTGAGAATTCAGCA 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 1 C GGCAC GAGGG CC CAGAGGAATAAGT TAACCTT GGT GCCT G CGT C CGT GAGAATT CAGCA 60 

Qy 61 TGGAATGTCTCTACTATTTCCTGGGATTTCTGCTCCTGGCTGCAAGATTGCCACTTGATG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 61 TGGAATGTCTCTACTATTTCCTGGGATTTCTGCTCCTGGCTGCAAGATTGCCACTTGATG 120 

Qy 121 C C G C CAAAC GAT T T CAT GAT GT GCT GGGCAAT GAAAGAC CT T CT GCTT ACAT GAGGGAG C 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 121 C C GC CAAAC GATTT CAT GAT GT G CT G G G CAAT GAAAGAC CT T CT GCTT ACAT GAGGGAGC 180 

Qy 181 ACAAT CAAT TAAAT GGCT GGT CTT CT GAT GAAAAT GACT GGAAT GAAAAACT CTAC CCAG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I 
Db 181 ACAAT CAATTAAAT GGCT GGT CT T CT GAT GAAAAT GACT G GAAT GAAAAACT CTAC C CAG 240 

Qy 241 TGTGGAAGCGGGGAGACATGAGGTGGAAAAACTCCTGGAAGGGAGGCCGTGTGCAGGCGG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

Db 241 TGTGGAAGCGGGGAGACATGAGGTGGAAAAACTCCTGGAAGGGAGGCCGTGTGCAGGCGG 300 



Qy 301 T C CT GAC CAGT GACT CAC CAGC CCT CGT GGGCT CAAAT ATAACATT T GC GGT GAAC CT GA 360 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 301 T CCT GAC CAGT GACT CAC CAGC CCT CGT GGGCT CAAATATAACATTTGCGGT GAAC CTGA 360 

Qy 361 TATT C C CT AGAT GC CAAAAGGAAGAT GC CAAT GGCAACAT AGT CT AT GAGAAGAACT GCA 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 TAT T C C CTAGAT GC CAAAAGGAAGAT GC CAAT GGCAACAT AGT CT AT GAGAAGAACT GCA 420 

Qy 421 GAAAT GAGGCTGGTTTAT CTGCTGAT CCATAT GTTTACAACT GGACAGCATGGTCAGAGG 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 421 GAAAT GAGGCTGGTTTATCTGCT GAT CCATAT GTTTACAACT GGACAGCAT GGTCAGAGG 480 

Qy 481 ACAGTGACGGGGAAAATGGCACCGGCCAAAGCCATCATAACGTCTTCCCTGATGGGAAAC 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 AC AGT GAC GGGGAAAAT GGC AC C G GC CAAAGC CAT CATAAC GT CT T CC CT GATGGGAAAC 540 

Qy 541 CTTT T C CT CAC CAC C C C GGAT GGAGAAGAT GGAATT T CAT CTAC GT CTT C C AC ACACT T G 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 541 CT TT T C CT CAC CAC C C C GGAT GGAGAAGAT GGAATT T CAT CTAC GT CTT C CACAC ACT T G 600 

Qy 601 GT CAGTATTT CCAGAAATT GGGACGATGTT CAGT GAGAGTTTCT GT GAACACAGCCAAT G 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 GT CAGT ATT T C CAGAAATT G GGAC GAT GTT CAGT GAGAGT TT CT GT GAACACAG C CAAT G 660 

Qy 661 T GACACT T GGGC CT CAACT CAT GGAAGT GACT GT CT ACAGAAGACAT GGAC G GGC AT AT G 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 T GACACTT GGGC CT CAACT CAT GGAAGT GACT GT CT ACAGAAGACAT G GACG GGCATAT G 720 

Qy 721 T T C C CAT C G C ACAAGT GAAAGAT GT GT AC GT G GT AAC AG AT C AGAT TCCTGTGTTTGT GA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 721 T T C C CAT C G C ACAAGT GAAAGAT GT GT AC GT G GT AAC AG AT C AGAT TCCTGTGTTTGT G A 780 

Qy 781 CT AT GTT C CAGAAGAAC GAT C GAAATT CAT C C GACGAAAC CT T C CCAAAGAT CT CC C CAT 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 781 C TAT G T T C C A G AAG AA C GAT C GAAAT T CAT C C GAC G AAAC C T T C C C AAAG AT C T C C C CAT 840 

Qy 841 TAT GTT T GAT GT C CT GAT T CAT GAT C CTAGC CACT T CCT CAAT TATTCT AC CATTAACT A 900 

I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 TAT GT T T GAT GT C CTGAT T CAT GAT C CT AG C CACTT CCTCAATT AT T CT AC CATTAACT A 900 

Qy 901 CAAGT GGAGCTT C G G GGAT AAT ACT GGC CT GT TT GT TT C CAC CAAT CAT ACT GT GAAT C A 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 CAAGT GGAGCT T C GGGGATAATACT GGC CT GTTT GT TT C CAC CAAT CAT ACT GT GAAT CA 960 

Qy 961 CACGTATGTGCTCAATGGAACCTTCAGCCTTAACCTCACTGTGAAAGCTGCAGCACCAGG 1020 

I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 CAC GT AT GTGCT CAAT GGAACCT T CAGC CTTAACCT CACT GT GAAAGCT GCAGCAC CAGG 1020 

Qy 1021 ACCTTGTCCGCCACCGCCACCACCACCCAGACCTTCAAAACCCACCCCTTCTTTAGGACC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1021 ACCTTGTCCGCCACCGCCACCACCACCCAGACCTTCAAAACCCACCCCTTCTTTAGGACC 1080 

Qy 1081 T G CT GGT GACAACC CC CT GGAGCT GAGT AGGAT T CCT GAT GAAAACT GCC AGAT TAAC AG 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 T G CT GGT GACAAC C CC CT GGAG CT GAGT AGGATT CCT GAT GAAAACTGCCAGATTAACAG 1140 

Qy 1141 AT AT GGC CACTTT CAAGC CACCAT CACAAT T GTAGAGGGAAT CT T AGAGGTTAAC AT CAT 1200 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1141 AT AT GGCCACT TT CAAGC CAC CAT CACAATTGT AGAGGGAAT CT TAGAGGTTAACAT CAT 1200 

1201 CCAGATGACAGACGTCCTGATGCCGGTGCCATGGCCTGAAAGCTCCCTAATAGACTTTGT 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CCAGAT GACAGAC GTC CT GAT GC C GGT GCCAT GGC CT GAAAG CT CCCTAAT AGACTTT GT 1260 

1261 CGT GAC CT GC CAAGGGAGCAT TC C CACGGAGGT CT GT AC CAT CATTT CT GACCC CAC CT G 1320 

I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 C GT GAC CT GC CAAGGGAG CAT TC C CACGGAGGT CT GT AC CAT CATTT CT GAC CCCAC CT G 1320 

1321 C GAGAT CAC C CAGAACACAGT CT GCAGC C CT GT G GAT GT G GAT GAGAT GT GT CT GCT GAC 1380 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1321 C GAGAT CAC C CAGAACACAGT CT GCAGCCCTGT GGAT GT GGAT GAGATGTGTCT GCT GAC 1380 

1381 TGTGAGACGAACCTTCAATGGGTCTGGGACGTACTGTGTGAACCTCACCCTGGGGGATGA 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I 

1381 T GT GAGAC GAAC CT TCAAT GGGT CT GGGAC GT ACT GT GT GAAC CT C ACC CT G GG GGAT GA 1440 

1441 CACAAGCCTGGCTCTCACGAGCACCCTGATTTCTGTTCCTGACAGAGACCCAGCCTCGCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 CACAAGC CT GG CT CT CAC GAGCAC C CT GAT TT CT GTT C CT GAC AGAGAC CCAGC CT C GC C 1500 

1501 TTTAAGGATGGCAAACAGTGCCCTGATCTCCGTTGGCTGCTTGGCCATATTTGTCACTGT 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 TTTAAGGATGGCAAACAGTGCCCTGATCTCCGTTGGCTGCTTGGCCATATTTGTCACTGT 1560 

1561 GATCT CCCTCTT GGTGTACAAAAAACACAAGGAATACAACCCAATAGAAAATAGTCCT GG 1620 

I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
1561 GATCT CCCT CTT GGTGTACAAAAAACACAAGGAATACAACCCAATAGAAAATAGTCCT GG 1620 

1621 GAATGTGGTCAGAAGCAAAGGCCTGAGTGTCTTTCTCAACCGTGCAAAAGCCGTGTTCTT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 GAATGTGGTCAGAAGCAAAGGCCTGAGTGTCTTTCTCAACCGTGCAAAAGCCGTGTTCTT 1680 

1681 CC CG GGAAAC CAG GAAAAGGAT C C GCTACT CAAAAAC CAAGAAT T TAAAGGAGT TT CT TA 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 CC CG GGAAAC CAG GAAAAGGAT C C GCTACT CAAAAAC CAAGAAT T TAAAGGAGT TT CTTA 1740 

1741 AATT T C GAC CT T GTTT CT GAAGCT CACTTTT C AGT GC C ATTGAT GT GAGAT GTGCT GGAG 1800 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
1741 AATTTCGACCTTGTTTCTGAAGCTCACTTTTCAGTGCCATTGATGTGAGATGTGCTGGAG 1800 

1801 TGGCTATTAACCTTTTTTTCCTAAAGATTATTGTTAAATAGATATTGTGGTTTGGGGAAG 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 TGGCTATTAACCTTTTTTTCCTAAAGATTATTGTTAAATAGATATTGTGGTTTGGGGAAG 1860 

1861 TTGAATTTTTTATAGGTTAAATGTCATTTTAGAGATGGGGAGAGGGATTATACTGCAGGC 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
1861 TT GAAT T T T TTAT AGGTTAAAT GT CATTTT AGAGAT GGGGAGAGGGATT AT ACT GCAGGC 1920 

1921 AGCT T CAGC CAT GT T GT GAAACT GATAAAAGCAACTTAGCAAG GCT T CTT T T CATTAT TT 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
1921 AG CT T CAGC CAT GTTGT GAAACT GATAAAAGCAACTTAGCAAGGCT T CTTT T CATTATTT 1980 

1981 TT TAT GTTT CACTT ATAAAGT CTTAGGTAACT AGT AG GAT AGAAACACT GT GTCCC GAGA 204 0 
I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 



Db 



1981 TTTAT GTT T CACTT ATAAAGT CT TAGGTAACTAGT AGGAT AGAAACACT GT GT CCC GAGA 2040 



Qy 2041 GTAAGGAGAGAAG CTACT ATT GATT AGAGC CTAAC C CAG GT TAACT GCAAGAAGAGG C GG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 2041 GTAAGGAGAGAAG CTACTATTGATTAGAGC CTAAC CCAGGT TAACT GCAAGAAGAGGCGG 2100 

Qy 2101 GAT ACT TT CAG CT TT C CAT GTAACT GTAT GCATAAAGCCAAT GTAGTC CAGT T TCTAAGA 2160 

I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 GAT ACT TT CAG CT TT C CAT GTAACT GTAT GCATAAAGCCAATGTAGTCCAGTT TCTAAGA 2160 

Qy 2161 T CATGTTCCAAGCTAACT GAATCCCACTT CAATACACACT CAT GAACTCCTGATGGAACA 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 T CAT GTTCCAAGCTAACTGAATCCCACTTCAATACACACTCAT GAACTCCT GATGGAACA 2220 

Qy 2221 ATAACAGGCC CAAGC CT GT GGTAT GAT GT GCAC ACT T GCTAGACT CAGAAAAAATACT AC 2280 

i I I I 1 I I I I I I I I. I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 2221 ATAACAGG C C CAAGC CT GT GGTAT GAT GT GCAC ACT TGCTAGACT CAGAAAAAATACT AC 2280 

Qy 2281 TCTCATAAATGGGTGGGAGTATTTTGGTGACAACCTACTTTGCTTGGCTGAGTGAAGGAA 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 TCTCATAAATGGGTGGGAGTATTTTGGTGACAACCTACTTTGCTTGGCTGAGTGAAGGAA 2340 

Qy 2341 TGATATTCATATATTCATTTATT CCAT GGACATTTAGTTAGT GCTTTTTATATACCAGGC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 TGATATTCATATATTCATTTATTCCATGGACATTTAGTTAGTGCTTTTTATATACCAGGC 24 00 

Qy 2401 AT GAT G CT GAGTGACACT CT T GT GTAT AT T T C CAAATTTT T GT AT AGT CGCT G CACAT AT 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2401 AT GAT G CT GAGT GACACT CT T GT GTAT AT TT C CAAAT TTT T GTAT AGT C GCT G CACAT AT 24 60 

Qy 2461 TTGAAATCAAAATATTAAGACTTTCCAAAAATTTGGTCCCTGGTTTTTCATGGCAACTTG 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2461 TTGAAATCAAAATATTAAGACTTTCCAAAAATTTGGTCCCTGGTTTTTCATGGCAACTTG 2520 

Qy 2521 ATCAGTAAGGATT T C C CCT CT GT TT GGAACTAAAAC CATT T ACTAT AT GT TAGACAAGAC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2521 AT CAGTAAGGATT TCCCCTCTGTTT GGAACTAAAAC CATT T AC TAT AT GTTAGACAAGAC 2580 

Qy 2581 ATTTT T TTTT T TT C CTT C CT GAAAAAAAAAT GAG GGAAGAGACAAAAAAAAAAAAAAAAA 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 ATTTTTTTTTTTTCCTTCCTGAAAAAAAAATGAGGGAAGAGACAAAAAAAAAAAAAAAAA 2640 

Qy 2641 AAAAAAAAAAAAAAAAAAAAA 2661 

I I I I I I I I I I I I I I I I I II I I 
Db 2641 AAAAAAAAAAAAAAAAAAAAA 2661 
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Query Match 100.0%; Score 2661; DB 17; Length 2661; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2661; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 CGGCACGAGGGCCCAGAGGAATAAGTTAACCTTGGTGCCTGCGTCCGTGAGAATTCAGCA 60 

I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 CGGCACGAGGGCCCAGAGGAATAAGTTAACCTTGGTGCCTGCGTCCGTGAGAATTCAGCA 60 

Qy 61 TGGAATGTCTCTACTATTTCCTGGGATTTCTGCTCCTGGCTGCAAGATTGCCACTTGATG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TGGAATGTCTCTACTATTTCCTGGGATTTCTGCTCCTGGCTGCAAGATTGCCACTTGATG 120 

Qy 121 C C GC CAAAC GAT T T CAT GATGT GCT GGGCAAT GAAAGAC CT TCT G CT TACAT GAGGGAGC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 CCGCCAAACGATTTCATGATGT GCT GGGCAAT GAAAGACCTTCTGCTTACATGAGGGAGC 180 

Qy 181 ACAAT CAAT TAAAT GGCTGGTCTTCT GAT GAAAAT GACT GGAAT GAAAAACT CT AC CCAG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 181 ACAAT CAAT TAAAT GGCT G GT CT T CT GAT GAAAAT GACT GGAAT GAAAAACT CT AC CCAG 240 

Qy 241 TGTGGAAGCGGGGAGACAT GAG GTG GAAAAACT CCTGGAAGGGAGGCCGTGTGCAGGCGG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I LI I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 TGTGGAAGCGGGGAGACATGAGGTGGAAAAACTCCTGGAAGGGAGGCCGTGTGCAGGCGG 300 

Qy 301 T C CT GAC CAGT GACT CACCAG C C CT C GT GG GCT CAAATATAACATT T GC GGT GAAC CT GA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 T C CT GAC CAGT GACT CACCAG C C CT C GT GG GCT CAAATATAACATT T GC GGT GAAC CT GA 360 

Qy 361 T ATT CC CT AGAT GC CAAAAGGAAGAT GC CAAT GGCAAC AT AGT CT AT GAGAAGAACT GCA 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I J I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 TATT CCCTAGATGCCAAAAGGAAGAT GCCAATGGCAACATAGTCTAT GAGAAGAACTGCA 420 

Qy 421 GAAAT GAG GCT GGTT T ATCT GCT GAT C CAT AT GTT TACAACT GGACAGCAT G GT CAGAGG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GAAAT GAGGCT GGTT T ATCT GCT GAT C CAT AT GT T TACAACT GGACAG CAT GGT CAGAGG 480 

Qy 481 AC AGTGAC GG GGAAAAT GG CAC C G GC CAAAGCCAT CATAAC GT CT T C C CT GAT GGGAAAC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 481 AC AGTGAC GGGGAAAAT GGCAC C GG C CAAAGCCAT CATAAC GT CTT C C CT GATGGGAAAC 540 

Qy 541 CTTTTC CT CAC CAC CC C GGAT GGAGAAGAT GGAAT T T CAT CTACGT CTT C CAC ACACT T G 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 541 CTTTTCCTCACCACCCCGGATGGAGAAGATGGAATTTCATCTACGTCTTCCACACACTTG 600 

Qy 601 GT CAGT AT T T C CAGAAATT G GGAC GAT GTT CAGT GAGAGT TT CT GT GAACACAGC CAAT G 660 



Db 601 GT CAGTATTT C CAGAAATT GGGAC GAT GTT CAGT GAGAGT TT CTGTGAACACAGCGAATG 660 

Qy 661 T GACACTT GGGC CT CAACT CAT G GAAGT GACT GT CT ACAGAAGACAT GGAC GGG CATATG 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 T GACACTT GGGC CT CAACT CAT GGAAGT GACT GT CTACAGAAGACAT GGAC GGG CATATG 720 

Qy 721 TT CCCATCGCACAAGTGAAAGAT GTGTACGTGGTAACAGAT CAGATT CCTGTGTTT GTGA 780 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 TT CCCATCGCACAAGTGAAAGAT GTGTACGTGGTAACAGAT CAGATT CCTGTGTTTGT GA 780 

Qy 781 C TAT G T T C C AGAA G AAC GAT C GAAAT T CAT C C G AC G AAAC C T T C C C AAAG AT CT C C C CAT 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 C TAT G T T C C AGAAG AAC GAT C GAAAT T CAT C C GAC G AAAC C T T C C C AAAG AT C T C C C CAT 840 

Qy 841 TATGTTTGATGTCCTGATTCATGATCCTAGCCACTTCCTCAATTATTCTACCATTAACTA 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 TATGTTTGATGTCCTGATTCATGATCCTAGCCACTTCCTCAATTATTCTACCATTAACTA 900 

Qy 901 CAAGT GGAGCT T C G G GGATAAT ACT G GC CT GT TT GT T T C CAC CAAT CAT ACT GT GAAT CA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 CAAGT GGAGCT T C G G GGATAAT ACT G GC CT GT TT GT T T C CAC CAAT CAT ACT GT GAAT CA 960 

Qy 961 CACGTATGTGCTCAATGGAACCTTCAGCCTTAACCTCACTGTGAAAGCTGCAGCACCAGG 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 CACGT ATGT GCT CAAT GGAAC CT T CAGC CTTAAC CT CACT GTGAAAG CT GCAGCAC CAGG 1020 

Qy 1021 ACCTTGTCCGCCACCGCCACCACCACCCAGACCTTCAAAACCCACCCCTTCTTTAGGACC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 ACCTTGTCCGCCACCGCCACCACCACCCAGACCTTCAAAACCCACCCCTTCTTTAGGACC 1080 

Qy 1081 T GCT GGTGACAACC C CCT GGAGCT GAGTAGGATT C CT GAT GAAAACT GC CAGAT TAACAG 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1081 T GCT GGT GACAAC C C CCT GGAGCT GAGT AG GATT C CT GAT GAAAACT G C CAGAT TAACAG 1140 

Qy 1141 AT AT GGCCACT TT CAAGCC ACCAT CACAAT TGTAGAGGGAAT CTTAGAG GTTAACATCAT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 AT AT GGC CAC T T T CAAGCC AC CAT CACAAT T GTAGAG GGAAT CTTAGAG GTTAAC AT CAT 1200 

Qy 1201 CCAGATGACAGACGTCCTGATGCCGGTGCCATGGCCTGAAAGCTCCCTAATAGACTTTGT 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 CCAGATGACAGACGTCCTGATGCCGGTGCCATGGCCTGAAAGCTCCCTAATAGACTTTGT 1260 

Qy 1261 C GT GAC CT GC CAAGG GAGCAT T C C CACGGAGGT CT GT AC CAT CAT TT CT GAC CC CACCT G 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 1261 CGT GAC CT GC CAAG G GAGCATT C C CAC G GAGGT CT GTACCAT CAT TT CT GAC CC CACCT G 1320 

Qy 1321 CGAGAT CACC CAGAACACAGTCTGCAGCCCTGTGGATGT GGAT GAGATGT GTCTGCTGAC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1321 C GAG AT CAC C C AGAAC ACAGT C T G CAGC C CT GT G GAT GT G GAT GAGAT GTGTCTGCT GAC 1380 

Qy 1381 T GTGAGAC GAAC CTT CAAT G G GT CT GGGAC GT ACT GT GT GAAC CT CAC CCTG GG GGAT GA 1440 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 TGTGAGACGAACCTTCAATGGGTCTGGGACGTACTGTGTGAACCTCACCCTGGGGGATGA 144 0 

Qy 1441 CACAAGCCTGGCTCTCACGAGCACCCTGATTTCTGTTCCTGACAGAGACCCAGCCTCGCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 



Db 1441 CACAAGCCTGGCTCTCACGAGCACCCTGATTTCTGTTCCTGACAGAGACCCAGCCTCGCC 1500 

Qy 1501 TTTAAGGATGGCAAACAGTGCCCTGATCTCCGTTGGCTGCTTGGCCATATTTGTCACTGT 1560 

I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 TTTAAGGATGGCAAACAGTGCCCTGATCTCCGTTGGCTGCTTGGCCATATTTGTCACTGT 1560 

Qy 1561 GAT CT CCCTCTTGGT GT ACAAAAAACACAAGGAAT ACAAC C CAAT AGAAAAT AGT C CT GG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 1 I I I I I I I I I I I I 
Db 1561 GATCTCCCT CTTGGT GTACAAAAAACACAAGGAATACAACC CAAT AGAAAAT AGT CCTGG 1620 

Qy 1621 GAATGTGGTCAGAAGCAAAGGCCTGAGTGTCTTTCTCAACCGTGCAAAAGCCGTGTTCTT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 GAATGTGGTCAGAAGCAAAGGCCTGAGTGTCTTTCTCAACCGTGCAAAAGCCGTGTTCTT 1680 

Qy 1681 CCCGGGAAACCAGGAAAAGGATCCGCTACTCAAAAACCAAGAATTTAAAGGAGTTTCTTA 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I 

Db 1681 CC CGG GAAAC CAG GAAAAGGAT C C GCTACT CAAAAACCAAGAATTTAAAGGAGT TT CTT A 1740 

Qy 1741 AATT T CGAC CTT GT T T CT GAAG CT CACT T T T CAGT G CCATT GAT GT GAGAT GT GCT GGAG 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 AATTTCGACCTTGTTTCTGAAGCTCACTTTTCAGTGCCATTGATGTGAGATGTGCTGGAG 1800 

Qy 1801 TGGCTATTAACCTTTTTTTCCTAAAGATTATTGTTAAATAGATATTGTGGTTTGGGGAAG 18 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 TGGCTATTAACCTTTTTTTCCTAAAGATTATTGTTAAATAGATATTGTGGTTTGGGGAAG 18 60 

Qy 1861 TT GAATTT TT TAT AG GTTAAAT GT CATT T TAGAGAT GGG GAGAGGGAT TAT ACT GC AGG C 1920 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 T T GAATTT TT TAT AGGT TAAAT GT CATTTTAGAGAT GGGGAGAGGGAT TAT ACT GCAGG C 1920 

Qy 1921 AG CT T CAGC CAT GTT GT GAAACT GATAAAAG CAACT TAGCAAG GCT T CTTT T CATT ATT T 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1921 AGCTT CAGC CAT GTT GT GAAACT GATAAAAGCAACTTAGCAAG GCT TCTTTT CATT ATT T 1980 

Qy 1981 TT TAT GT T T CACT T ATAAAGT CTT AGGTAACTAGT AG GATAGAAACACT GT GT C C C GAGA 2040 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1981 T TTAT GT TT CACT T ATAAAGT CTT AGGTAACTAGT AG GAT AGAAACACT GT GT C C CGAGA 204 0 

Qy 2041 GTAAG GAGAGAAGCT ACT AT T GAT T AGAG C CTAACC CAGGTTAACT G CAAGAAGAG G CGG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 GTAAGGAGAGAAGCTACTATT GATTAGAGCCTAACCCAGGTTAACT GCAAGAAGAGGCGG 2100 

Qy 2101 GATACTTTCAGCTTT CCATGTAACTGTATGCATAAAGCCAAT GTAGT CCAGTTT CTAAGA 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 GAT ACTT T CAGCT TT C CAT GTAACT GTAT GCATAAAGC CAAT GTAGT CCAGTTT CTAAGA 2160 

Qy 2161 TCATGTT CCAAGCTAACT GAAT CC CACT T CAAT ACACACT CAT GAACT CCT GATGGAACA 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2161 TCATGTT CCAAGCTAACT GAATCCCACTT CAAT ACACACTCAT GAACT CCT GAT GGAACA 2220 

Qy 2221 ATAACAGGC C CAAGC CT GTGGT AT GATGT GCACACT T GCTAGACTCAGAAAAAAT ACTAC 2280 

II I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I II I I I I I I I I I I I I I 

Db 2221 ATAACAG G C C CAAGC CT GTGGT AT GATGT GCAC ACTT G CTAGACT CAGAAAAAAT ACTAC 2280 

Qy 2281 TCTCATAAATGGGTGGGAGTATTTTGGTGACAACCTACTTTGCTTGGCTGAGTGAAGGAA 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 2281 TCTCATAAATGGGTGGGAGTATTTTGGTGACAACCTACTTTGCTTGGCTGAGTGAAGGAA 2340 



Qy 2341 
Db 2341 



T GAT ATTCAT ATATT CATTT AT T CCAT GGACAT TT AGTT AGT GCT TTTT ATAT AC CAGGC 2400 

I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

T GAT ATT CAT ATATT CAT TT AT T C CAT GGACAT TT AGTTAGT GCT TTTT AT AT AC CAG GC 2400 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2401 AT GAT G CT GAGT GAC ACT CT T GT GT ATATTT CCAAATTTTT GTATAGT CGCT GCAC AT AT 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I 

2401 AT GAT G CT GAGT GAC ACT CT T GT GT ATATT T C CAAATT TT T GTATAGT CGCT GCACAT AT 2460 

2461 TTGAAATCAAAATATTAAGACTTTCCAAAAATTTGGTCCCTGGTTTTTCATGGCAACTTG 2520 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
2461 TTGAAATCAAAATATTAAGACTTTCCAAAAATTTGGTCCCTGGTTTTTCATGGCAACTTG 2520 

2521 ATCAGTAAGGATTTCCCCTCT GTTT GGAACTAAAAC CATTTACTATAT GTTAGACAAGAC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2521 AT C AGTAAGGATT T CCCCTCTGTTT GGAACTAAAAC CATTTACTATAT GTTAGACAAGAC 2580 

2581 ATTTTTTTTTTTTCCTTCCTGAAAAAAAAATGAGGGAAGAGACAAAAAAAAAAAAAAAAA 2640 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2581 ATTTTTTTTTTTTCCTTCCTGAAAAAAAAATGAGGGAAGAGACAAAAAAAAAAAAAAAAA 2640 

2641 AAAAAAAAAAAAAAAAAAAAA 2661 

I I I I I I I I I I I I I I I I I I I I I 
2641 AAAAAAAAAAAAAAAAAAAAA 2661 
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BC025297 2636 bp mRNA linear HTC 08-MAR-2002 

Homo sapiens, glycoprotein (transmembrane) nmb, clone 
IMAGE: 4877773, mRNA. 
BC025297 

BC025297.1 GI:19264140 
HTC. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 2636) 
Strausberg, R. 
Direct Submission 

Submitted ( 05-MAR-2002 ) National Institutes of Health, Mammalian 
Gene Collection (MGC) , Cancer Genomics Office, National Cancer 
Institute, 31 Center Drive, Room 11A03, Bethesda, MD 20892-2590, 
USA 

NIH-MGC Project URL: http://mgc.nci.nih.gov 

Contact: MGC help desk 

Email : cgapbs-r@mail . nih . gov 

Tissue Procurement: ATCC/DCTD/DTP 

cDNA Library Preparation: Rubin Laboratory 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 

DNA Sequencing by: Genome Sequence Centre, 

BC Cancer Agency, Vancouver, BC, Canada 

inf o@bcgsc .be. ca 

Steven Jones, Jennifer Asano, Ian Bosdet, Yaron Butterfield, 
Susanna Chan, Readman Chiu, Chris Fjell, Erin Garland, Ran Guin, 
Letticia Hsiao, Martin Krzywinski, Reta Kutsche, Oliver Lee, Soo 
Sen Lee, Victor Ling, Carrie Mathewson, Candice McLeavy, Steven 
Ness, Pawan Pandoh, Anna-Liisa Prabhu, Parvaneh Saeedi, Jacqueline 
Schein, Duane Smailus, Michael Smith, Lorraine Spence, Jeff Stott, 
Michael Thorne, Miranada Tsai, Natasja van den Bosch, Jill Vardy, 
George Yang, Scott Zuyderduyn, Marco Marra. 

Clone distribution: MGC clone distribution information can be found 
through the I.M.A.G.E. Consortium/LLNL at: http://image.llnl.gov 
Series: IRAL Plate: 42 Row: i Column: 5 

This clone was selected for full length sequencing because it 
passed the following selection criteria: matched mRNA gi : 4505404 
This clone has the following problem: frame shifted. 

Location/Qualifiers 

1. .2636 

/organism="Homo sapiens" 
/mol type= ,, mRNA n 



/db_xref="LocusID: 10457" 
/db_xref="taxon: 9606" 
/ cl one= " IMAGE :4877773 ,f 

/tissue_type="Skin, melanotic melanoma, high MDR. " 

/clone_lib= ,, NIH_MGC_49" 

/lab_host="DH10B-R" 

/note="Vector : pOTB7" 



ORIGIN 



Query Match 95.8%; Score 2550; DB 3; Length 2636; 

Best Local Similarity 99.1%; Pred. No. 0; 

Matches 2595; Conservative 0; Mismatches 20; Indels 3; Gaps 3; 

Qy 28 AACCTTGGTGCCTGCGTCCGTGAGAATTCAGCATGGAATGTCTCTACTATTTCCTGGGAT 87 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 20 ACCT T GAGT GC CT GC GT C C GT GAGAATT CAGC AT G GAAT GT CT CT ACT ATTT C CT GGGAT 79 

Qy 88 TTCTGCTCCTGGCTGCAAGATTGCCACTTGATGCCGCCAAACGATTTCATGATGTGCTGG 147 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 80 TTCTGCTCCTGGCTGCAAGATTGCCACTTGATGCCGCCAAACGATTTCATGATGTGCTGG 139 

Qy 148 G CAAT GAAAGAGCTT CTG CT T ACAT GAGGGAGCACAAT CAATTAAAT G GCT GGT CT T CTG 207 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 140 GCAATGAAAGACCTTCTGCTTACATGAGGGAGCACAATCAATTAAATGGCTGGTCTTCTG 199 

Qy 208 AT GAAAAT GACTGGAAT GAAAAACT CT AC CCAGT GT GGAAGC GGGGAGACATGAGGT GGA 267 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 200 AT GAAAAT GACT GGAAT GAAAAACT CTAC C CAGT GT GGAAGCGG GGAGACAT GAGGT GAA 259 

Qy 268 AAAACTCCTGGAAGGGAGGCCGTGTGCAGGCGGTCCTGACCAGTGACTCACCAGCCCTCG 327 

I I I I I I I II II I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 2 60 AAAACT C CT GGAAG GGAGGCCGTGTGCAGGCGGTCCTGAC CAGT GACT CAC CAGC CCTCG 319 

Qy 328 T GG GCT CAAAT ATAACAT T T GCGGT GAAC CT GAT ATT C C CT AGAT G CCAAAAGGAAGATG 387 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I 

Db 320 T GG GCT CAAAT AT AAC ATT T GCG GT GAAC CT GAT ATTC CCT AGAT G CCAAAAGGAAGAT G 379 

Qy 388 C CAAT GG CAACAT AGT CTAT GAGAAGAACT GC AGAAAT GAGGCT G GTT TAT CT GCT GAT C 447 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 380 C CAAT G GCAAC AT AGT CTAT GAGAAGAACT G CAGAAAT GAGGCT GGTT TAT CT GCT GATC 439 

Qy 448 CAT AT GTTT ACAACT GGACAG CAT GGT CAGAGGAC AGT GAC GG GGAAAAT GGCAC C GG C C 507 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 440 C GT AT GTT T ACAACTG GAC AG CAT GGT CAGAGGACAGT GAC GG GGAAAAT GGCAC CGG CC 499 

Qy 508 AAAGC CAT CAT AAC GT CT T C C CT GAT GGGAAAC CT TTT C CT CAC CACC C C G GAT G GAGAA 567 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 500 AAAGC CAT CAT AAC GT CTT C CCT GAT GGGAAAC CTTTT C CT CAC CACC CC GGAT GGAGAA 559 

Qy 568 GAT GGAATTTCAT CTACGTCTTCCACACACTTGGT CAGT ATTT CCAGAAATTGGGAC GAT 627 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 560 GAT GGAAT T T CAT CTAC GT CT T C CACACACTT GGT CAGT ATTT C CAGAAAT T GGGACGAT 619 

Qy 628 GTTCAGT GAGAGTTTCT GT GAACACAGCCAATGTGACACTT GGGCCTCAACTCATGGAAG 687 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 620 GTT CAGT GAGAGT T TCT GT GAACACAGC CAAT GT GACACTT GGG C CTCAACT CAT GGAAG 679 



Qy 

Db 



688 T GACTGTCTACAGAAGACAT GGACGGGCATAT GTTCCCAT CGCACAAGTGAAAGAT GTGT 747 

I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
680 T GACT GT CTACAGAAGACAT GGACGGGCATAT GTT CC CAT C GCACAAGT GAAAGAT GT GT 739 



Qy 748 ACGTGGTAACAGATCAGATTCCTGTGTTTGTGACTATGTTCCAGAAGAACGATCGAAATT 807 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 740 AC GT GGTAACAGAT CAGAT T CCT GT GTT T GT GACT AT GTT C CAGAAGAACGAT C GAAATT 799 

Qy 808 CAT C CGAC GAAAC CTT C C- CAAAGAT CT C CCCAT TAT GTTT GAT GT C CT GAT T CAT GAT C 866 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 800 CAT C C GAC GAAACCT T CCT CAAAGAT CT C CC CATT AT GTT T GAT GT C CT GATT CAT GAT C 859 

Qy 867 CTAGCCACT T CCT CAAT T ATT CT AC CAT TAACTACAAGT G GAGCT T CGGGGATAAT ACT G 926 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 860 CTAGCCACTTCCTCAATTATTCTACCATTAACTACAAGTGGAGCTTCGGGGATAATACTG 919 

Qy 927 GCCTGTTTGTTTC CAC CAAT CAT ACT GT GAAT CACAC GT AT GT G CTCAAT GGAACCT TCA 986 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 920 GCCT GT TT GT TTCCAC CAAT CATACTGT GAAT CACAC GTATGTGCT CAAT GGAAC CTT C A 979 

Qy 987 GCCTTAACCTCACTGTGAAAGCTGCAGCACCAGGACCTTGTCCGCCACCGCCACCACCAC 1046 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 980 GCCT T AAC CT C ACT GT GAAAG CT GCAGCAC CAGGAC CTT GT C C GC CAC CGC CAC CAC CAC 1039 

Qy 1047 CCAGACCTTCAAAACCCACCCCTTCTTTAGGACCTGCTGGTGACAACCCCCTGGAGCTGA 1106 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1040 CCAGACCTTCAAAACCCACCCCTTCTTTAGGACCTGCTGGTGACAACCCCCTGGAGCTGA 1099 

Qy 1107 GT AG GAT T CCT GAT GAAAACT GC CAGATTAACAGAT AT GG C CACT TT CAAGCCACCAT CA 1166 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 1100 GT AG GAT T C CT GAT GAAAACT G C CAGAT T AAC AGAT AT G G C CACT TT CAAGC CAC CAT C A 1159 

Qy 1167 CAATT GTAGAGGGAAT CTT AGAGGTTAACAT CAT C CAGAT GACAGACGT C CTGAT GC CGG 1226 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1160 CAAT T GT AGAG G GAAT CT T AGAG GT T AAC AT CAT C CAGAT GAC AG AC GT C CT GAT G C C G G 1219 

Qy 1227 TGCCATGGCCTGAAAGCTCCCTAATAGACTTTGTCGTGACCTGCCAAGGGAGCATTCCCA 1286 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I II I I I I I I I I M I I I I I I I 

Db 1220 TGCCATGGCCTGAAAGCTCCCTAATAGACTTTGTCGTGACCTGCCAAGGGAGCATTCCCA 1279 

Qy 1287 C G GAGGT CT GT AC CAT CAT T T CT GAC C CCACCT GC GAGAT CACC C AGAACACAGT CT GC A 1346 

I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1280 CGGAGGT CTGTACCAT CATTT CT GACCCCACCT GC GAGATCACCCAGAACACAGTCTGCA 1339 

Qy 1347 GC CCT GT GGAT GT G GAT GAGAT GT GT CTG CT GACT GT GAGAC GAAC CT T CAAT GGGT CT G 1406 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1340 GC CCT GT G GAT GT GGAT GAGAT GT GT CT GCTGACT GTGAGAC GAAC CTT CAAT G GGT CT G 1399 

Qy 1407 GGACGTACTGTGTGAACCTCACCCTGGGGGATGACACAAGCCTGGCTCTCACGAGCACCC 1466 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 1400 G GAC GTACTGT GT GAAC CT CACC CTGGGGGAT GACACAAGC CT GGCT CT CAC GAGCACC C 1459 

Qy 14 67 TGATTTCTGTTCCTGACAGAGACCCAGCCTCGCCTTTAAGGATGGCAAACAGTGCCCTGA 1526 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1460 TGATTTCTGTTCCTGACAGAGACCCAGCCTCGCCTTTAAGGATGGCAAACAGTGCCCTGA 1519 

Qy 1527 TCTCCGTTGGCTGCTTGGCCATATTTGTCACTGTGATCTCCCTCTTGGTGTACAAAAAAC 1586 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II I 

Db 1520 TCTCCGTTGGCTGCTTGGCCATATTTGTCACTGTGATCTCCCTCTTGGTGTACAAAAAAC 1579 

Qy 1587 ACAAGGAAT ACAAC C CAAT AGAAAAT AGT C CT GG GAAT GT GGT CAGAAGCAAAGGC CT GA 1646 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1580 ACAAG GAAT ACAAC C CAAT AGAAAAT AGT CCT G GGAAT GT GGT CAGAAGCAAAGG C CT GA 1639 

Qy 1647 GTGTCTTTCTCAACCGTGCAAAAGCCGTGTTCTTCCCGGGAAACCAGGAAAAGGATCCGC 1706 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I II II I I I I I I I I I I I I I I 
Db 1640 GTGTCTTTCTCAACCGTGCAAAAGCCGTGTTCTTCCCGGGAAACCAGGAAAAGGATCCGC 1699 

Qy 1707 TACTCAAAAACCAAGAATTTAAAGGAGTTTCTTAAATTTCGACCTTGTTTCTGAAGCTCA 1766 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1700 TACTCAAAAACCAAGAATTTAAAGGAGTTTCTTAAATTTCGACCTTGTTTCTGAAGCTCA 1759 

Qy 1767 CTTTTCAGTGCCATTGATGTGAGATGTGCTGGAGTGGCTATTAACCTTTTTTTCCTAAAG 1826 

I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1760 CTTTTCAGTGCCATTGATGTGAGATGTGCTGGAGTGGCTATTAACCTTTTTTTCCTAAAG 1819 

Qy 1827 ATTAT T GTTAAAT AGAT ATT GT GGTT T GGGGAAGTT GAATT TTT TATAGGT TAAAT GT CA 1886 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1820 ATT ATT GT TAAAT AGAT AT TGTGGTTTGGG GAAGT T GAAT TT TT TAT AGGT TAAAT GT CA 187 9 

Qy 1887 T TTT AGAGAT GG GGAGAGG GAT T AT ACT GCAGGCAGCT T C AGCCAT GTT GT GAAACT GAT 1946 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1880 TTTTAGAGAT GGGGAGAGGGATTATACT GCAGGCAGCTT CAGCCAT GTTGT GAAACTGAT 1939 

Qy 1947 AAAAGCAACTTAGCAAGGCTTCTTTTCATTATTTTTTATGTTTCACTTATAAAGTCTTAG 2006 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1940 AAAAGCAACTTAGCAAGGCTTCTTTTCATTATTTTTTATGTTTCACTTATAAAGTCTTAG 1999 

Qy 2007 GTAACT AGTAG GAT AGAAACACT GT GT CC C GAGAGTAAGGAGAGAAGCT ACT ATT GAT TA 2066 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2000 GTAACT AGTAGGAT AGAAACACT GT GT C CC GAGAGTAAG GAGAGAAGCTACTATT GAT TA 2059 

Qy 2067 GAGCCTAACCCAGGTTAACTGCAAGAAGAGGCGGGATACTTTCAGCTTTCCATGTAACTG 2126 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2060 GAGCCTAACCCAGGTTAACTGCAAGAAGAGGCGGGATACTTTCAGCTTTCCATGTAACTG 2119 

Qy 2127 TAT GC ATAAAGC CAATGT AGT C C AGTT T CTAAGAT CAT GT T C CAAGCTAACT GAAT C C CA 2186 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 2120 TAT G C AT AAAG C CAAT GT AGT C C AGT T T CTAAGAT CAT GT T C C AAG CT AACT GAAT C C C A 217 9 

Qy 2187 CTTCAATACACACT CAT GAACT CCTGATGGAACAATAACAGGCCCAAGCCT GT GGT AT GA 2246 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2180 CT T CAAT ACACACT CAT GAACT CCT GAT GGAACAATAAC AGG CC CAAGC CT GT GGT AT GA 2239 

Qy 2247 T GT GCACACT T GCT AGACT CAGAAAAAAT ACT ACT CT CATAAAT G GGT GGGAGT ATTT TG 2306 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2240 T GT GCACACT TGCTAGACT CAGAAAAAAT ACTACT CT CATAAAT GGGT GGGAGT ATTTTG 2299 

Qy 2307 GT GACAAC CT ACTTT GCT T G G CTGAGT GAAGGAAT GAT ATT CAT AT ATT CAT T TAT T C CA 2366 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 2300 GT GACAAC CT ACT TT GCT T GGCT GAGT GAAG GAAT GAT ATT CAT AT ATT CATT T ATTC CA 2359 

Qy 2367 T GGACATT TAGT T AGTG CTT T T TAT AT AC CAGGCAT GATG CT GAGT GACACT CTT GT GTA 2426 

I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I 



2360 T GGACATT T AGTT AGT GCT T T T TATATACCAGGCAT GAT GCT GAGT GACACT CT TGT GTA 2419 

2427 T ATTT C CAAATT TTT GT ATAGT C GCT GCACAT ATTT GAAAT CAAAATATTAAGACT TT CC 2486 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
2420 TATTTC CAAAT TT TT GT ACAGT C G CT GCACAT ATTT GAAAT C- AT AT AT TAAGACTTT C C 2478 

2487 AAAAATTTGGTCCCTGGTTTTTCATGGCAACTTGATCAGTAAGGATTTCCCCTCTGTTTG 2546 

I II II I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2479 AAAGATGAGGTCCCTGGTTTTTCATGGCAACTTGATCAGTAAGGATTTCACCTCTGTTTG 2538 

2547 GAACTAAAACCATTTACTATATGTTAGACAAGACATTTTTTTTTTTTCCTTCCTGAAAAA 2606 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2539 TAACTAAAAC CAT CT ACT AT AT GT T AGACAT GACAT T CTT TTT CTCTCCTTCCT GAAAAA 2598 

2607 - AAAAT GAGGGAAGAGACAAAAAAAAAAAAAAAAAAAA 2 643 

III II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
2599 T AAAGT GT GGGAAGAGACAAAAAAAAAAAAAAAAAAAA 2636 



GenCore version 5.1.6 
Copyright (c) 1993 - 2005 Compugen Ltd 



OM nucleic - protein search, using f rame_jplus_n2p model 

Run on: February 18, 2005, 22:03:33 ; Search time 355 Seconds 

(without alignments) 
5798.137 Million cell updates/sec 



Title: 

Perfect score: 
Sequence : 



US-10-039-272-1 
4850 

1 cggcacgagggcccagagga 



aaaaaaaaaaaaaaaaaaaa 2661 



Scoring table: 



Searched: 



BLOSUM62 
Xgapop 10.0 
Ygapop 10.0 
Fgapop 6.0 
Delop 6.0 



Xgapext 0.5 

Ygapext 0 . 5 

Fgapext 7 . 0 

Delext 7.0 



2105692 seqs, 386760381 residues 



Total number of hits satisfying chosen parameters: 



4211384 



Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 



Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



Command line parameters : 
-MODEL=frame+_n2p. model -DEV=xlp 

Q=/cgn2_l/USPTO_spool_p/US10039272/runat_18022005_095204_14690/app_query. fastaJL 
.2823 

-DB=A_Geneseq_16Dec04 -QFMT=fastan -SUFFIX=rag -MINMATCH=0 . 1 -LOOPCL=0 
-LOOPEXT=0 -UNITS=bits -START=1 -END=-1 -MATRIX=blosum62 -TRANS=human4 0 . cdi 
-LIST=45 -DOCALIGN=200 -THR_SCORE=pct -THR_MAX=100 -THR__MIN=0 -ALIGN=15 
-MODE=LOCAL -OUTFMT=pto -NORM=ext -HEAPSIZE=500 -MINLEN=0 -MAXLEN=2 0 0 0000 000 
-USER=US10039272__@CGN_l_l_398_@runat_18022005_095204_14 690 -NCPU=6 -ICPU=3 
-NO_MMAP - LARGEQUERY -NEG_SCORES=0 -WAIT -DSPBLOCK=100 -LONGLOG 

-DEV_TIMEOUT=120 -WARN_TIMEOUT=30 -THREADS=1 -XGAPOP=10 -XGAPEXT=0.5 -FGAPOP=6 
-FGAPEXT =7 -YGAPOP=10 -YGAPEXT=0.5 -DELOP=6 -DELEXT=7 



Database : A_Geneseq_16Dec04 : * 

1 : geneseqpl98 0s : * 

2: geneseqpl990s : * 

3: geneseqp2000s : * 

4: geneseqp2001s : * 

5: geneseqp2002s : * 

6: geneseqp2003as : * 

7: geneseqp2003bs : * 

8: geneseqp2004s : * 



Pred. No. is the number of results predicted by chance to have a 



score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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GenCore version 5.1.6 



Copyright (c) 1993 - 2005 Compugen Ltd. 



OM nucleic - protein search, using f rame_plus_n2p model 

Run on: February 18, 2005, 22:15:00 ; Search time 73 Seconds 

(without alignments) 
5442.224 Million cell updates/sec 



Title: 

Perfect score: 
Sequence : 



US-10-039-272-1 
4850 

1 cggcacgagggcccagagga 



aaaaaaaaaaaaaaaaaaaa 2661 



Scoring table: 



BLOSUM62 

Xgapop 10.0 , Xgapext 

Ygapop 10.0 , Ygapext 

Fgapop 6.0 , Fgapext 

Delop 6.0 , Delext 



0.5 
0.5 
7.0 
7.0 



Searched : 



513545 seqs, 74649064 residues 



Total number of hits satisfying chosen parameters: 



1027090 



Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 

Command line parameters: 
-M0DEL=f rame+_n2p . model -DEV=xlp 

Q=/cgn2_l/USPTO_spool_p/US10039272/runat_18022005_095206_14721/app_query. fastaJL 
.2823 

-DB=Issued_Patents_AA -QFMT=fastan -SUFFIX=rai -MINMATCH=0 . 1 -LOOPCL=0 
-LOOPEXT=0 -UNITS=bits - START =1 -END=-1 -MATRIX=blosum62 -TRANS=human40 . cdi 
-LIST=45 -DOCALIGN=200 -THR_SCORE=pct -THR_MAX=100 -THR_MIN=0 -ALIGN=15 
-MODE-LOCAL -OUTFMT=pto -NORM=ext -HEAPSIZE=500 -MINLEN=0 -MAXLEN=2 000000000 
-USER=USlOO39272_0CGN_l_l_72_@runat_18O22OO5_O952O6_14721 -NCPU=6 -ICPU=3 
-NO_MMAP -LARGEQUERY -NEG_SCORES=0 -WAIT -DSPBLOCK=100 -LONGLOG 

-DEV_TIMEOUT=120 -WARN_TIMEOUT=30 -THREADS=1 -XGAPOP=10 -XGAPEXT=0.5 -FGAPOP=6 
-FGAPEXT =7 -YGAPOP=10 -YGAPEXT=0 . 5 -DELOP=6 -DELEXT=7 



Database : 



Issued_Patents_AA: * 

1: /cgn2_6/ptodata/l/iaa/5A_COMB.pep: * 

2: /cgn2_6/ptodata/l/iaa/5B_COMB.pep:* 

3: /cgn2_6/ptodata/l/iaa/6A_COMB.pep: * 

4 : / cgn2_6/ptodata/ 1/iaa/ 6B_COMB . pep : * 

5: /cgn2_6/ptodata/l/iaa/PCTUS_COMB.pep: * 

6: /cgn2 6/ptodata/l/iaa/backf ilesl . pep : * 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution.' 



SUMMARIES 



% 

Result Query 

No. Score Match Length DB ID 



Description 
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GenCore version 5.1.6 
Copyright (c) 1993 - 2005 Compugen Ltd. 



OM nucleic - protein search, using frame plus_n2p model 



Run on: 



February 18, 2005, 22:44:56 ; Search time 303.5 Seconds 

(without alignments) 
5738.309 Million cell updates/sec 



Title: 

Perfect score : 
Sequence : 

Scoring table: 



US-10-039-272-1 
4850 

1 cggcacgagggcccagagga 



aaaaaaaaaaaaaaaaaaaa 2661 



BLOSUM62 
Xgapop 10.0 
Ygapop 10.0 
Fgapop 6 . 0 
Delop 6.0 



Xgapext 
Ygapext 
Fgapext 
Delext 



0.5 
0.5 
7.0 
7.0 



Searched: 



1380268 seqs, 327241040 residues 



Total number of hits satisfying chosen parameters: 2760536 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 

Command line parameters : 
-MODEL=f rame+_n2p. model -DEV=xlp 

Q=/cgn2_l/USPTO__spool_p/US10039272/runat_18022005_095208_14781/app_query. fasta_l 
.2823 

-DB=Published_Applications_AA -QFMT=fastan -SUFFIX=rapb -MINMATCH=0 . 1 
-LOOPCL=0 -LOOPEXT=0 -UNITS=bits -START=1 -END=-1 -MATRIX=blosum62 
-TRANS=human40.cdi -LIST=45 -D0CALIGN=2 00 -THR_SCORE=pct -THR_MAX=100 
-THR_MIN=0 -ALIGN=15 -MO DE= LOCAL -OUTFMT=pto -NORM=ext -HEAPSI ZE=5 00 -MINLEN=0 
-MAXLEN=2 000000000 -USER=US10039272_@CGN_l_l_393_@runat_18022005_095208_14781 
-NCPU=6 -ICPU=3 -NO_MMAP -LARGEQUERY -NEG_SCORES=0 -WAIT -DSPBLOCK=100 
-LONGLOG -DEV_TIMEOUT=120 - WARN_T IMEOUT= 3 0 -THREADS=1 -XGAPOP=10 -XGAPEXT=0.5 
-FGAPOP=6 -FGAPEXT=7 -YGAPOP=10 -YGAPEXT=0 . 5 -DELOP-6 -DELEXT=7 



Database : 



Published_Applications_AA: * 

1 : /cgn2_6/ptodata/2/pubpaa/US07_PUBCOMB . pep : 
/cgn2 6/ptodata/2/pubpaa/PCT NEW PUB.pep:* 



2 
3 
4 
5 
6 
7 
8 
9 
10 
11 
12 
13 
14 
15 
16 



/cgn2~6/ptodata/2/pubpaa/PCT_NEW_ir 
/cgn2_6/ptodata/2/pubpaa/US06_NEW_PUB.pep: * 
/cgn2_6/ptodata/2/pubpaa/US06_PUBCOMB.pep: * 
/cgn2_6/ptodata/2/pubpaa/US07_NEW_PUB.pep: * 
/cgn2_6/ptodata/2/pubpaa/PCTUS_PUBCOMB.pep: * 
/cgn2_6/ptodata/2/pubpaa/US08_NEW_PUB . pep : * 
/cgn2_6/ptodata/2/pubpaa/US08_PUBCOMB.pep:* 
/cgn2_6/ptodata/2/pubpaa/US09A_PUBCOMB . pep : * 
/cgn2_6/ptodata/2/pubpaa/US09B_PUBCOMB.pep: * 
/cgn2_6/ptodata/2/pubpaa/US09C_PUBCOMB.pep: * 
/cgn2_6/ptodata/2/pubpaa/US09_NEW_PUB.pep: * 
/cgn2_6/ptodata/2/pubpaa/US10A_PUBCOMB.pep: * 
/cgn2_6/ptodata/2/pubpaa/US10B_PUBCOMB.pep: * 
/cgn2_6/ptodata/2/pubpaa/US10C_PUBCOMB . pep : * 
/cgn2_6/ptodata/2/pubpaa/US10D_PUBCOMB . pep : * 



17 : /cgn2_6/ptodata/2/pubpaa/US10_NEW_PUB.pep: * 

18 : /cgn2_6/ptodata/2/pubpaa/USll_NEW_PUB.pep: * 

19: /cgn2_6/ptodata/2/pubpaa/US60_NEW_PUB.pep: * 

20: /cgn2_6/ptodata/2/pubpaa/US60_PUBCOMB.pep: * 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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44 2979 61.4 572 14 US-10-219-528-42 

45 2979 61.4 572 14 US-10-227-880-42 



Sequence 42, Appl 
Sequence 42 , Appl 



GenCore version 5.1.6 
Copyright (c) 1993 - 2005 Compugen Ltd. 



OM nucleic - protein search, using f rame_plus_n2p model 

Run on: February 18, 2005, 22:06:53 ; Search time 91 Seconds 

(without alignments) 
5627.095 Million cell updates/sec 



Title: 

Perfect score: 
Sequence : 



US-10-039-272-1 
4850 

1 cggcacgagggcccagagga 



aaaaaaaaaaaaaaaaaaaa 2661 



Scoring table: BLOSUM62 

Xgapop 10.0 , Xgapext 0.5 

Ygapop 10.0 , Ygapext 0 . 5 

Fgapop 6.0 , Fgapext 7 . 0 

Delop 6.0 , Delext 7.0 

Searched: 283416 seqs, 96216763 residues 

Total number of hits satisfying chosen parameters: 566832 

■ 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 



Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



Command line parameters: 
-M0DEL=f rame+_n2p. model -DEV=xlp 

Q=/cgn2_l/USPTO_spool_p/US10039272/runat_18022005_095205_14708/app_query. fasta_l 
.2823 

-DB=PIR_79 -QFMT=fastan -SUFFIX=rpr -MINMATCH=0 . 1 -LOOPCL=0 -LOOPEXT=0 
-UNITS=bits -START=1 -END=-1 -MATRIX=blosum62 -TRANS=human40 . cdi -LIST=45 
-DOCALIGN=200 -THR_SCORE=pct -THR_MAX=100 -THR_MIN=0 -ALIGN=15 -MO DE= LOCAL 
-OUTFMT=pto -NORM=ext -HEAPSI ZE=500 -MINLEN=0 -MAXLEN=2 000000000 
-USER=US10039272_@CGN_l_l_135_@runat_18022005_095205__14708 -NCPU=6 -ICPU=3 
-NO__MMAP -LARGEQUERY -NEG_SCORES=0 -WAIT -DSPBLOCK=100 -LONGLOG 

-DEV_TIMEOUT=120 -WARN_TIMEOUT=30 -THREADS=1 -XGAPOP=10 -XGAPEXT=0 . 5 -FGAPOP=6 
-FGAPEXT =7 -YGAPOP=10 -YGAPEXT=0 . 5 -DELOP=6 -DELEXT=7 



Database : 



PIR 79:* 



1 
2 
3 
4 



pirl : * 
pir2:* 
pir3 : * 
pir4 : * 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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GenCore version 5.1.6 



Copyright (c) 1993 - 2005 Compugen Ltd. 



OM nucleic - protein search, using f rame_plus_n2p model 



Run on: 



Title: 

Perfect score: 
Sequence : 

Scoring table: 



February 18, 2005, 22:04:28 ; Search time 445 Seconds 

(without alignments) 
6124.237 Million cell updates/sec 



US-10-039-272-1 
4850 

1 cggcacgagggcccagagga 



aaaaaaaaaaaaaaaaaaaa 2661 



BLOSUM62 
Xgapop 10.0 
Ygapop 10.0 
Fgapop 6.0 
Delop 6.0 



Xgapext 0.5 

Ygapext 0.5 

Fgapext 7 . 0 

Delext 7.0 



Searched: 



1612378 seqs, 512079187 residues 



Total number of hits satisfying chosen parameters: 3224756 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 

Command line parameters: 
-MODEL=f rame+_n2p. model -DEV=xlp 

Q=/cgn2_l/USPTO_spool_p/US10039272/runat_18022005__095205_14696/app_query. fasta 
.2823 

-DB=UniProt_03 -QFMT=fastan -SUFFIX=rup -MINMATCH=0 . 1 -LOOPCL=0 -LOOPEXT=0 
-UNITS=bits -START=1 -END=-1 -MATRIX=blosum62 -TRANS=human40 . cdi -LIST=45 
-DOCALIGN=200 -THR_SCORE=pct -THR_MAX=100 -THR_MIN=0 -ALIGN=15 -MODE= LOCAL 
-0UTFMT=pto -NORM-ext -HEAPSIZE=500 -MINLEN=0 -MAXLEN=2 0 0 0 0 00000 
-USER=US10039272_@CGN_l_l_518_@runat_18022005_095205_14696 -NCPU=6 -ICPU=3 
-NO_MMAP -LARGEQUERY -NEG_SCORES=0 -WAIT -DSPBLOCK=100 -LONGLOG 

-DEV_TIMEOUT=120 -WARN_TIMEOUT=30 -THREADS=1 -XGAPOP=10 -XGAPEXT=0 . 5 -FGAPOP=6 
-FGAPEXT =7 -YGAPOP=10 -YGAPEXT=0.5 -DELOP=6 -DELEXT=7 



Database : 



UniProt_03:* 

1 : uniprot_sprot : * 

2: uniprot trembl:* 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 



SUMMARIES 
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Result Query 

No. Score Match Length DB ID 



Description 



1 

J. 


9999 

Cm -S Zt Z) 


61 


p 

u 


560 


1 

X 


MMR HI IMAM 


Ol 4 Q 56 
yi4 j jo 


XiUIUvj bapicil 


2 

Cm 


2983 

Cm ~s \J 


61 


5 


572 


2 

Cm 


OfiNl A1 
yuii in x 


Oftnl 3 1 
y oiiia x 


llvOlLlvj bapicil 


3 


2979 


61 

\J X ■ 


4 


512 


2 


06UVX1 


06i i\/v 1 
yuu vAi 


ViOTTIO cani pn 
iiuiuu oapicil 


4 




44 


7 


574 


2 


099P91 




mi l e mi ic/^nl n 

mus muscuiu 


5 
o 




4 4 


7 


574 


2 

c. 


Dfi RWQ 


OftK'vnrQ 

JJ V V 5 


ttii i c mi i e /— • 1 1 1 1 1 


6 


2170 


44 


7 


574 


2 


O9OXA0 


^ ^ M A CI \J 


mi i c; mi i e pn 1 n 


7 


2166 


44 


7 


574 


2 




Ofihvl 4 


mi i q mi i c i 1 1 1 1 

IILUO IllvX o \*m Li X Li 


8 


2152 


44 . 


4 


572 


2 


06P7C7 


06d7c7 


Ye\ f~ t" \ ] nnrv 


9 


2136 


44 


0 


572 


9 


090ZF6 


09a7 f 6 

J U i. 1 u 




1 0 

X w 


201 S 


4 1 

i X • 


s 


526 


2 

c. 


OftRVAO 




mi l c; mi i c; \ 1 1 i i 


1 1 

X X 


1 56^ 5 


?9 


2 


559 

■j -j y 


1 

X 


OMR POT.TA 


DQ0?79 

y Z7 D O i Cm 


COLUIIllA CO 


1 2 


1 029 

X \J Cm J? 


21 

£< X • 


2 

Cm 


206 

t. w u 


2 

c* 


096F58 

^ JUL O U 


096f 58 

y juuu 


ii\Jiii\j oap±cii 


1 ? 

X o 


1 099 


9 1 

C. X » 


1 

X 


9 06 
z. vj o 


9 


Oft TY.T5 


nft i v-i 5 

yoiAj o 




1 4 

X 1 


711 5 


1 4 

XI. 


7 


721 


2 

c. 




H6HHn6 
yuuunu 


ACllup Uo lac 


1 5 

X -J 


704 5 


1 4 

XI. 




74 6 


2 

c. 




06Hi r2 

\/ UUl X Cm 


ACilUpUo U. X U 


1 6 

X vj 


64 4 5 

D 1 *± • O 


1 3 

X O • 




626 

vj 


2 

c. 


09r7R9 

y J wtj Oc. 


OQr7h? 


mi i q mi lcf'iil n 


1 7 

X r 


6^5 

D O O 


1 ^ 

X o . 


i 

X 


62 6 


1 

X 


PM1 7 MOTI^F 


060696 


mi l c; mi icnil 11 
1UU.O XlLLio i^LiX Li 


18 

X \J 


631 5 


13 

X — » • 


o 


760 


2 


06DW64 


06Hw64 


rT^lln^ rrsll 
uqxiuo uaxx 


X 


630 

vj J v 


1 3 


o 


733 


2 


093391 


093391 

V-/ J J J J X 


LUlillA y~-\J 




69 Q 5 

-7 • J 


1 ^ 


n 


7 64 


9 


^ DXVW DO 


06Hw6? 

DUW D O 


rta line na 1 1 
LjallUo LJaXl 


9 1 

X 


69 ft 


1 9 
iz • 


Q 

-7 


7 6? 

' / DO 


9 

c. 


O 6 nw 6 9 


06Ht*t69 


ydiiub yaii 


9? 

C. C. 


690 5 


1 9 
x^. . 


ft 

O 


7 ft ft 


9 


06DW65 

yOUn DO 


06Hw6 5 


rf a 1 1 lie na 1 1 

LjaiiUis Ljctxx 


2 ^ 


61 7 

D X / 


1 2 

X £ . 


7 


762 


1 

X 


Pi 1 5 THICK 


098917 


rr^llnc* rr^l 1 
^ctxxLio y ct x x 


9 4 


61 9 


1 9 


a 

D 


7ft? 

/ O J 


9 

c. 


O6DW60 

yOUW D U 


06Hw6 0 
youw D D 


rfa line rta 1 1 
LjallUb ydll 


9 5 


60Q 


1 9 
iz . 


6 


7 59 


2 

Cm 


H6DW61 

^ OUW D X 


06dw61 


na 1 1 ii c rrall 
y ail Uo uaii 


9 6 


o y o 


1 9 


9 


661 


1 

X 


PM1 7 HTTMAM 


P4 0967 

t 1 D 17 D # 


1101110 bdpicii 


97 


4^6 5 


Q 




4 91 

4 -7 X 


1 

X 


PM1 7 RHVTW 


O061 54 

D D X J *1 




9 ft 


"37 9 

O / Cm 


7 


7 


4 61 

4 D X 


9 


OQ7ft R4 

\Jj / 004 


097 ft ft 4 

\J _7 / O O 4 


CUUUo LdiJul 


9 Q 


9 Zl 7 5 


Q 

o • 




9 ? 6 
zoo 


9 

Cm 


HQOV67 


OQrr\/67 


mi i c mi i c 1 1 1 1 




1 Qft 5 


A 

4 • 


i 

X 


4 9? 

4 £ O 


9 

Cm 




Oft n OwQ 
y oiiuw ^ 


llwillvj odpicil 


7 1 

O X 


1 Qft 5 

X Z? O . O 


4 

4 • 


1 

X 


4 ? 5 


9 

Cm 


^ O IN O VJ _7 


Oft n ?n Q 
\sO no y _7 


llOlllO sapicll 


O c. 


1 Q9 


A 

4 . 


VJ 


?Q7 

O .7/ 


9 

Cm 


DftM?R9 

\l O IN O t\c. 


Oft n ? r9 


IlLJiiHJ sdLJXcril 


O O 


1 67 


*3 

O • 


4 

4 


141 

X 4 X 


9 

Cm 


D9nY7 0 


09nw7 0 

_7 L^y / D 


mi i c mi i c 1 1 1 i i 


O 4 


154 5 


*3 

O • 


9 


419 

4X3 


9 
c. 


y DIN Al'lO 


O 6n vm ? 


mi i c: mi ldfiil ii 


O o 


i m 


o 

O • 


n 

X 


? 54 

O O 4 


9 
c. 


nft T Y4 6 
yoi i 4u 


Oft "i w4 6 

yOly4 D 


V>/*MiiA e an "i on 
IILJIIHJ o dpicll 


^ 6 
o D 


X 4 X • o 


9 


Q 


Q06 


9 

Cm 


HftTPYQ 
yO 1 r I _? 


O ft 1- T> \7 Q 


maf Vi an a c 3 r /-* 


^7 
O / 


1 ^ 5 
1 J J 


9 


ft 
O 


4 4 6 

44D 


9 

Cm 


0994 5ft 

\JCm Cm H O O 


0224 58 


r*Vi 1 amvHnninn 
L,ni diiiy u^iu^ii 


38 


134 5 


2 


ft 
\J 


1817 

X \J X / 


2 

Cm 


08TT59 


08ti59 


lllv^ Oil U 1 X w fcw> X. V — ■ 


O j 


1 "31 


9 


7 


ft7Q 
o / y 


9 

Cm 


Oft PTXT.T6 
yO tW U D 


Oft'nwn 6 

\S O W J D 


mofharioca rr 
1LLC UllClllvJoclXO 


40 


129.5 


2. 


1 


1131 


2 


Q75DJ5 


Q75dj5 


ashbya goss 


41 


129 


2. 


1 


926 


1 


PTN4_HUMAN 


P29074 


homo sapien 


42 


128.5 


2. 


6 


688 


2 


Q8TR88 


Q8tr88 


methanosarc 


43 


127.5 


2. 


6 


3988 


2 


Q8TPZ1 


Q8tpzl 


methanosarc 


44 


126 


2. 


6 


603 


2 


Q7U5X8 


Q7u5x8 


synechococc 


45 


125.5 


2. 


6 


881 


2 


Q6H7U3 


Q6h7u3 


oryza sativ 



